杀疯了!谷歌卷视频到语音,逼真音效让AI视频告别无声!
文章摘要
【关 键 词】 AI技术、视频生成语音、DeepMind、音频效果、V2A
谷歌DeepMind最近发布了一项视频生成语音(V2A)技术的进展,该技术可以为视频内容自动生成匹配的音效和配音,结束了AI视频只有画面没有声音的历史。这项技术通过结合视频像素和自然语言文本提示,为屏幕上的动作创建丰富的音频效果,如脚步声、狼嚎和背景音乐等。它还可以与现有的视频生成模型如Veo联合使用,为档案材料、无声电影等传统影像生成音轨,拓宽了创作的可能。
此技术不仅关注正面提示来引导音频生成,还允许用户通过负面提示来避免不期望的声音,提供了极大的灵活性。此外,V2A技术可以无限量地为任何视频输入生成音轨,并且能够快速试验不同的音频输出以找到最佳匹配。
原文和模型
【原文链接】 阅读原文 [ 4039字 | 17分钟 ]
【原文作者】 机器之心
【摘要模型】 generalv3.5
【摘要评分】 ★★☆☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...