作者信息
【原文作者】 开源AI项目落地
【作者简介】 分享有价值的开源项目,并且致力于Ai项目的落地。
【微 信 号】 gh_922ed6d49ee6
文章摘要
【关 键 词】 音频工具、音乐生成、语音生成、研究支持、模型架构
Amphion是一个面向音频、音乐和语音生成的工具包,旨在支持可复制研究,并帮助初级研究人员和工程师进入音频、音乐和语音生成领域。它提供了多种功能,包括TTS、SVS、VC、SVC、TTA和TTM。Amphion支持多种先进的模型架构,如基于扩散的、基于变换器的、基于VAE的和基于流的模型。此外,它还支持各种神经声码器,如基于GAN的、基于流的、基于扩散的和基于自回归的声码器。Amphion提供了全面的客观评估指标,包括基频建模、能量建模、可理解性、频谱失真和说话人相似性。项目地址为https://github.com/open-mmlab/Amphion。
原文信息
【原文链接】 阅读原文
【原文字数】 802
【阅读时长】 3分钟
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...