杀疯了！谷歌卷视频到语音，逼真音效让AI视频告别无声！

AIGC动态1年前 (2024)发布 almosthuman2014

2,636 0 0

杀疯了！谷歌卷视频到语音，逼真音效让AI视频告别无声！

文章摘要

【关键词】 AI技术、视频生成语音、DeepMind、音频效果、V2A

谷歌DeepMind最近发布了一项视频生成语音（V2A）技术的进展，该技术可以为视频内容自动生成匹配的音效和配音，结束了AI视频只有画面没有声音的历史。这项技术通过结合视频像素和自然语言文本提示，为屏幕上的动作创建丰富的音频效果，如脚步声、狼嚎和背景音乐等。它还可以与现有的视频生成模型如Veo联合使用，为档案材料、无声电影等传统影像生成音轨，拓宽了创作的可能。

此技术不仅关注正面提示来引导音频生成，还允许用户通过负面提示来避免不期望的声音，提供了极大的灵活性。此外，V2A技术可以无限量地为任何视频输入生成音轨，并且能够快速试验不同的音频输出以找到最佳匹配。

原文和模型

【原文链接】 阅读原文 [ 4039字 | 17分钟 ]
【原文作者】 机器之心
【摘要模型】 generalv3.5
【摘要评分】 ★★☆☆☆

讯飞星火API

【简介】科大讯飞推出的讯飞...

# AIGC动态 # 大模型 # 视频生成 # 音频生成 # AI技术 # DeepMind # V2A # 视频生成语音 # 音频效果

© 版权声明

文章版权归作者所有，未经允许请勿转载。

“绘蛙”

相关文章

a16z发布2025 AI语音图谱：语音将成为与AI交互的主要模式

Founder Park

1,339

朱啸虎炮轰：张予彤故意欺骗免费拿月之暗面14%创始股份，已被金沙江解雇｜钛媒体AGI

钛媒体AGI

1,091

东风岚图 AI 技术人才培养三步走：认知构建、技术提升、场景实战 | 极客时间企业版

AI前线

1,922

SemiAnalysis万字解析DeepSeek：训练成本、技术创新点、以及对封闭模型的影响

Founder Park

1,526

为了在AI时代做好“AI助手”，vivo做了哪些努力？

硅星人Pro

1,603

如何看待中国大模型天天对标美国GPT-4，但千亿龙头Q1亏3亿？｜钛媒体AGI

钛媒体AGI

3,151

“极客训练营”

暂无评论

暂无评论...