音频生成
音频,audio
Mamba正式被ICLR拒收!“年度最佳技术原理解读”却火了
Mamba,这个被寄予厚望的Transformer挑战者,尽管在学术界引起了广泛关注,但最终还是被ICLR会议拒绝。尽管如此,Mamba的热度并未受到影响,一篇关于它的最新...
安卓率先跑通多模态大模型,终端本地就能看图生成文本!高通:WiFi都会AI起来
在MWC 2024首日,高通展示了其在终端侧AI领域的最新进展。首先,高通成功将多模态大模型首次本地部署在安卓手机上,这意味着用户可以通过手机AI助手输入照片...
就是“快”!字节跳动发布文生图开放模型,迅速冲上Hugging Face Spaces 热榜
字节跳动智能创作团队介绍了他们最新的文生图模型SDXL-Lightning,该模型在速度和质量上实现了突破,并已向社区开放。SDXL-Lightning通过渐进式对抗蒸馏技术...
Sora爆火!人工智能将如何改变世界?
摘要:近期,人工智能技术的发展引起了广泛关注。美国OpenAI发布了首个视频生成模型“Sora”,能够根据文本指令生成60秒短视频。此外,谷歌公司的“巴德”(现更...
成就了Sora和Stable diffusion 3的DiTs,究竟是啥
本篇文章主要介绍了Stable AI发布的Stable Diffusion 3的两大特色:扩散transformers模型(DiTs)和流匹配(FM)。DiTs是一种基于transformer架构的图像潜变...
免费 AI “神器”系列第五弹:斯坦福洗碗机器人爆火,字节版DALL·E模型登上开源榜单前三|钛媒体AGI
文章介绍了五款创新的人工智能(AI)应用,这些应用在生成式人工智能(AIGC)领域具有很高的价值。这五款应用分别是:1. 斯坦福AI“螃蟹”洗碗机器人技术——UMI...
谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即
摘要总结:谷歌Research Lead蒋路,负责VideoPoet项目,已确认加入TikTok,继续在视频生成AI领域工作。蒋路在谷歌期间,带领团队推出了与Sora技术路线相似的...
追赶OpenAI的Sora:Meta开源V-JEPA,让AI学会认识世界!
Meta公司基于Yann LeCun提出的JEPA(联合嵌入预测架构)模型,开发了非生成视频模型V-JEPA。该模型旨在通过观察和自我思考、总结,使AI模型能够学习并模拟世...
不只是100万上下文,谷歌Gemini 1.5超强功能展示
AIGC领域的专业社区关注了微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,特别是谷歌发布的Gemini 1.5模型。尽管在发布当天遭遇...
中国AIGC技术与应用,发展峰会来啦!
在技术迅猛发展的今天,AIGC(人工智能生成内容)技术正成为推动创新和重塑行业边界的关键力量。这项技术通过人工智能算法,如自然语言处理(NLP)和深度学习...