标签:语音模型
OpenAI语音智能体诞生,怼脸实拍语气狂到飞起!API降到每分钟0.3美分
OpenAI最新发布的音频模型标志着语音智能体时代的正式开启。此次发布的三款模型——gpt-4o-transcribe、gpt-4o-mini-transcribe和gpt-4o-mini-tts,分别专注于...
刚刚,OpenAI首发语音Agent,智能体实现重大突破
OpenAI在凌晨的技术直播中发布了三款全新的语音模型,分别是GPT-40 Transcribe、GPT-4 Mini Transcribe和GPT-40 Mini TTS。这些模型专注于语音AI Agent的开发...
语音模型平台Cartesia获6400万美元,只需3秒克隆语音
语音模型平台Cartesia宣布获得6400万美元A轮融资,由Kleiner Perkins领投。同时,Cartesia推出了最新语音模型Sonic 2.0和Sonic Turbo,其中Sonic 2.0的语音克...
WebRTC创建者加入了OpenAI,他如何思考语音AI的未来?
WebRTC的联合创始人Justin Uberti,同时也是Fixie.ai的联合创始人兼CTO,宣布加入OpenAI领导实时AI项目。Uberti在Google时期参与创建并领导了WebRTC项目,并...
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
智谱清言近期宣布全量上线「情感语音通话」功能,为用户带来端到端的情感语音体验。该功能在响应速度、情绪感知、语音表达、多语言支持等方面实现突破,提供...
开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开
法国初创团队Kyutai开发的端到端语音模型Moshi已经开源,该模型以其自然聊天、情绪丰富、支持打断和非回合制对话等特点受到关注。模型参数量为7.69B,支持在p...
阿里开源新语音模型,比OpenAI的Whisper更好!
阿里巴巴公司在Qwen-Audio的基础上推出了新一代的开源语音模型Qwen2-Audio,该模型在多个方面进行了显著的优化和改进。Qwen2-Audio模型包含基础版和指令微调...
比OpenAI的Whisper快50%,最新开源语音模型
生成式AI公司aiOla在其官网开源了一款名为Whisper-Medusa的语音模型,该模型在推理效率上相较于OpenAI的Whisper模型提升了50%。Whisper-Medusa在Whisper的基...