标签:NaturalSpeech 3

仅听3秒,AI零样本克隆人声达到人类水平,情绪语调随意改

微软联合中国科技大学、香港中文大学(深圳)和浙江大学等机构推出的NaturalSpeech 3系统,实现了零样本的人类水平语音合成。该系统采用了属性分解扩散模型和...