标签：音频处理

开源端到端语音大模型：直接从原始音频输入，生成语音输出

Step-Audio团队近期开源了一个端到端的语音大模型Step-Audio-AQAA，该模型能够直接理解音频输入并生成自然流畅的语音回答，而无需先将语音转换为文本。这一技...

AIGC动态

1个月前