标签:实时语音

o1驾驶无人机后空翻,OpenAI开发者日惊掉下巴!2分钟爆改代码写App

在OpenAI伦敦开发者日上,o1模型展示了其五大核心能力:函数调用、开发者message、流式传输、结构化输出和图像理解。o1 mini与Cursor的联动在不到2分钟内搭建...

钛媒体AGI独家|大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品

AI大模型领域的独角兽MiniMax计划于11月推出一款Realtime API服务,旨在提升端到端实时多模态处理能力,提供更低延时、更自然、更沉浸的实时语音对话体验。这...

8 人团队的开源多模态:Moshi,效果堪比 GPT-4o,合成数据立功

法国非营利性AI研究机构Kyutai开发了一个名为Moshi的实时语音多模态模型,该模型具备听、说、看的能力,能够理解带有法国口音的英语。Moshi可以流畅地进行日...