音频生成
音频,audio
就是“快”!字节跳动发布文生图开放模型,迅速冲上Hugging Face Spaces 热榜
字节跳动智能创作团队介绍了他们最新的文生图模型SDXL-Lightning,该模型在速度和质量上实现了突破,并已向社区开放。SDXL-Lightning通过渐进式对抗蒸馏技术...
Sora爆火!人工智能将如何改变世界?
摘要:近期,人工智能技术的发展引起了广泛关注。美国OpenAI发布了首个视频生成模型“Sora”,能够根据文本指令生成60秒短视频。此外,谷歌公司的“巴德”(现更...
成就了Sora和Stable diffusion 3的DiTs,究竟是啥
本篇文章主要介绍了Stable AI发布的Stable Diffusion 3的两大特色:扩散transformers模型(DiTs)和流匹配(FM)。DiTs是一种基于transformer架构的图像潜变...
免费 AI “神器”系列第五弹:斯坦福洗碗机器人爆火,字节版DALL·E模型登上开源榜单前三|钛媒体AGI
文章介绍了五款创新的人工智能(AI)应用,这些应用在生成式人工智能(AIGC)领域具有很高的价值。这五款应用分别是:1. 斯坦福AI“螃蟹”洗碗机器人技术——UMI...
谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即
摘要总结:谷歌Research Lead蒋路,负责VideoPoet项目,已确认加入TikTok,继续在视频生成AI领域工作。蒋路在谷歌期间,带领团队推出了与Sora技术路线相似的...
追赶OpenAI的Sora:Meta开源V-JEPA,让AI学会认识世界!
Meta公司基于Yann LeCun提出的JEPA(联合嵌入预测架构)模型,开发了非生成视频模型V-JEPA。该模型旨在通过观察和自我思考、总结,使AI模型能够学习并模拟世...
不只是100万上下文,谷歌Gemini 1.5超强功能展示
AIGC领域的专业社区关注了微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,特别是谷歌发布的Gemini 1.5模型。尽管在发布当天遭遇...
中国AIGC技术与应用,发展峰会来啦!
在技术迅猛发展的今天,AIGC(人工智能生成内容)技术正成为推动创新和重塑行业边界的关键力量。这项技术通过人工智能算法,如自然语言处理(NLP)和深度学习...
LeCun怒斥Sora不能理解物理世界!Meta首发AI视频「世界模型」V-JEPA
在近期的人工智能领域,「世界模型」的概念引起了广泛关注。Sora和LeCun的V-JEPA模型相继问世,展示了AI在理解物理世界方面的潜力。Sora以其逼真的视频生成能...
AI配音版Sora视频刷屏!绝美逼真音效打破「无声电影」,或颠覆万亿美元产业
新智元报道:语音初创公司ElevenLabs利用AI技术为Sora经典视频完成了配音,这一突破性进展让网友惊叹,AI生成电影的时代似乎越来越近。ElevenLabs的AI语音技...