杀疯了!谷歌卷视频到语音,逼真音效让AI视频告别无声!

AIGC动态6个月前发布 almosthuman2014
1,117 0 0
杀疯了!谷歌卷视频到语音,逼真音效让AI视频告别无声!

 

文章摘要


【关 键 词】 AI技术视频生成语音DeepMind音频效果V2A

谷歌DeepMind最近发布了一项视频生成语音V2A)技术的进展,该技术可以为视频内容自动生成匹配的音效和配音,结束了AI视频只有画面没有声音的历史。这项技术通过结合视频像素和自然语言文本提示,为屏幕上的动作创建丰富的音频效果,如脚步声、狼嚎和背景音乐等。它还可以与现有的视频生成模型如Veo联合使用,为档案材料、无声电影等传统影像生成音轨,拓宽了创作的可能。

此技术不仅关注正面提示来引导音频生成,还允许用户通过负面提示来避免不期望的声音,提供了极大的灵活性。此外,V2A技术可以无限量地为任何视频输入生成音轨,并且能够快速试验不同的音频输出以找到最佳匹配。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 4039字 | 17分钟 ]
【原文作者】 机器之心
【摘要模型】 generalv3.5
【摘要评分】 ★★☆☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...