标签:音频处理

开源端到端语音大模型:直接从原始音频输入,生成语音输出

Step-Audio团队近期开源了一个端到端的语音大模型Step-Audio-AQAA,该模型能够直接理解音频输入并生成自然流畅的语音回答,而无需先将语音转换为文本。这一技...