标签:音频
折腾半天,我终于找到最懂中文的 AI 音频产品。
近年来,短视频平台上AI生成的内容逐渐增多,且许多创意内容获得了较高的点赞和评论数据。利用AI制作以往难以实现或成本较高的内容,被认为是一个潜在的机会...
阿里通义开源首个CoT音频模型,音·画同步被狠狠拿捏了
阿里通义语音团队最新开源的泛音频生成模型ThinkSound,首次将CoT思维链推理引入音频领域,解决了传统视频配乐技术难以捕捉画面动态细节和空间关系的难题。Th...
秒杀同行!Kimi开源全新音频基础模型,横扫十多项基准测试,总体性能第一
Kimi-Audio 是一个全新的通用音频基础模型,支持语音识别、音频理解、音频转文本、语音对话等多种任务,在多个音频基准测试中实现了最先进的性能。结果显示,...
6 个月估值增长 10 倍到 11 亿美金,AI 语音克隆彻底火了
阿根廷总统 Milei 在达沃斯世界经济论坛上的演讲引起了全球关注,他使用了 AI 技术将演讲实时翻译成英文并用自己的克隆语音读出。这项技术主要来自 HeyGen 和...