音频生成
音频,audio
免费 AI “神器”系列第五弹:斯坦福洗碗机器人爆火,字节版DALL·E模型登上开源榜单前三|钛媒体AGI
文章介绍了五款创新的人工智能(AI)应用,这些应用在生成式人工智能(AIGC)领域具有很高的价值。这五款应用分别是:1. 斯坦福AI“螃蟹”洗碗机器人技术——UMI...
谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即
摘要总结:谷歌Research Lead蒋路,负责VideoPoet项目,已确认加入TikTok,继续在视频生成AI领域工作。蒋路在谷歌期间,带领团队推出了与Sora技术路线相似的...
追赶OpenAI的Sora:Meta开源V-JEPA,让AI学会认识世界!
Meta公司基于Yann LeCun提出的JEPA(联合嵌入预测架构)模型,开发了非生成视频模型V-JEPA。该模型旨在通过观察和自我思考、总结,使AI模型能够学习并模拟世...
不只是100万上下文,谷歌Gemini 1.5超强功能展示
AIGC领域的专业社区关注了微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,特别是谷歌发布的Gemini 1.5模型。尽管在发布当天遭遇...
中国AIGC技术与应用,发展峰会来啦!
在技术迅猛发展的今天,AIGC(人工智能生成内容)技术正成为推动创新和重塑行业边界的关键力量。这项技术通过人工智能算法,如自然语言处理(NLP)和深度学习...
LeCun怒斥Sora不能理解物理世界!Meta首发AI视频「世界模型」V-JEPA
在近期的人工智能领域,「世界模型」的概念引起了广泛关注。Sora和LeCun的V-JEPA模型相继问世,展示了AI在理解物理世界方面的潜力。Sora以其逼真的视频生成能...
AI配音版Sora视频刷屏!绝美逼真音效打破「无声电影」,或颠覆万亿美元产业
新智元报道:语音初创公司ElevenLabs利用AI技术为Sora经典视频完成了配音,这一突破性进展让网友惊叹,AI生成电影的时代似乎越来越近。ElevenLabs的AI语音技...
Gemini一眼识破Sora视频是AI生成?百万token上下文能力碾压GPT-4
新智元报道:谷歌的Gemini 1.5模型在AI圈大佬们的极限测试中展现出了强大的实力。这些测试包括分析视频内容、处理长视频和音频、翻译稀有语言、理解长论文和...
OpenAI的Sora注定死路一条!Yann LeCun火力全开怒喷:这种实现方式“完全没有现实意义”
OpenAI发布Sora视频生成模型,引发全球关注OpenAI近日发布了一个名为Sora的视频生成模型,该模型能够生成长达60秒的高清视频,与以往只能生成几秒钟视频的模...
给 Sora 视频配音,ElevenLabs 推出 AI 音效生成功能,离 AI 生成电影又近了一步!
AI语音克隆公司ElevenLabs即将推出AI Sound Effects功能,该功能可以根据用户输入的提示自动生成声音,为视频添加逼真的背景声音。ElevenLabs的这项新功能在...