标签:VibeVoice

语音界Sora!微软刚开源新模型,一次生成90分钟语音、3200倍压缩率

微软研究院于今日凌晨开源创新音频模型VibeVoice - 1.5B,该模型在语音合成领域取得多项重大突破。它可一次性连续合成90分钟超长逼真语音,最多支持4名发言人...