实时语音 | 学习AIGC

DeepSeek会说话了！只要2行代码，这家公司让任意大模型秒开口

在AI行业的新赛道“多模态交互”中，声网推出了“对话式AI引擎”，使得所有文本大模型能够迅速获得实时语音对话能力，弥补了大模型在语音交互方面的不足。这一创...

AIGC动态

7个月前

豆包最新推出的超级实时语音功能在用户体验上超越了GPT4o的“Her”，提供了更符合国人习惯的交互体验。该功能以其超拟人的情绪反应、随时打断的能力、丰富的玩...

AIGC动态

8个月前

豆包即将发布一款新的实时语音大模型，并计划在豆包App中全面上线实时语音通话功能。这款模型在人机语音交互方面取得了显著进步，特别是在中文场景下，展现出...

AIGC动态

8个月前

在OpenAI伦敦开发者日上，o1模型展示了其五大核心能力：函数调用、开发者message、流式传输、结构化输出和图像理解。o1 mini与Cursor的联动在不到2分钟内搭建...

AIGC动态

11个月前

AI大模型领域的独角兽MiniMax计划于11月推出一款Realtime API服务，旨在提升端到端实时多模态处理能力，提供更低延时、更自然、更沉浸的实时语音对话体验。这...

AIGC动态

11个月前

法国非营利性AI研究机构Kyutai开发了一个名为Moshi的实时语音多模态模型，该模型具备听、说、看的能力，能够理解带有法国口音的英语。Moshi可以流畅地进行日...

AIGC动态

1年前 (2024)