Amphion:最全能的开源AI音频项目,在音频商业化方面有极大的帮助

AIGC动态10个月前更新 admin
1,338 0 0

作者信息


【原文作者】 开源AI项目落地
【作者简介】 分享有价值的开源项目,并且致力于Ai项目的落地。
【微 信 号】 gh_922ed6d49ee6

Amphion:最全能的开源AI音频项目,在音频商业化方面有极大的帮助

文章摘要


【关 键 词】 音频工具音乐生成语音生成研究支持模型架构

Amphion是一个面向音频、音乐和语音生成的工具包,旨在支持可复制研究,并帮助初级研究人员和工程师进入音频、音乐和语音生成领域。它提供了多种功能,包括TTSSVSVCSVCTTATTM。Amphion支持多种先进的模型架构,如基于扩散的、基于变换器的、基于VAE的和基于流的模型。此外,它还支持各种神经声码器,如基于GAN的、基于流的、基于扩散的和基于自回归的声码器。Amphion提供了全面的客观评估指标,包括基频建模、能量建模、可理解性、频谱失真和说话人相似性。项目地址为https://github.com/open-mmlab/Amphion。

原文信息


【原文链接】 阅读原文
【原文字数】 802
【阅读时长】 3分钟

© 版权声明

相关文章

暂无评论

暂无评论...