钛媒体AGI独家|大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品

AIGC动态1个月前发布 TMTPOSTAGI
256 0 0
钛媒体AGI独家|大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品

 

文章摘要


【关 键 词】 AI大模型实时语音多模态处理对话式AI市场增长

AI大模型领域的独角兽MiniMax计划于11月推出一款Realtime API服务,旨在提升端到端实时多模态处理能力,提供更低延时、更自然、更沉浸的实时语音对话体验。这款产品将服务于企业协作、社交、直播、游戏等多种场景,是MiniMax首款端到端实时语音对话产品。据悉,MiniMax内部正在积极打磨该产品,期望其效果能与OpenAI的GPT-4o相媲美。

OpenAI公司于今年5月推出了GPT-4o,这是一个可免费使用的全新旗舰AI模型,能够实时进行音频、视觉和文本推理。GPT-4o的响应速度与人类对话反应速度一致,平均响应时间为320毫秒。与去年11月发布的GPT-4-turbo相比,GPT-4o的价格降低了50%,速度提升了200%。OpenAI CEO Sam Altman表示,GPT-4o是公司有史以来最好的模型,具有智能、快速和原生多模态的特点。

此外,实时语音技术公司Agora作为语音API合作者,出现在了OpenAI发布的Realtime API公开测试版中。MiniMax也看到了这一机会,开始与声网合作,共同开发中国第一个Realtime API。声网创始人兼CEO赵斌在RTE 2024第十届实时互联网大会上表示,基于该API的智能体产品能够与人类进行轻松且流畅的实时语音交流。

目前,包括科大讯飞、智谱AI、商汤科技等中国企业都在研发生成式AI对话产品,其效果与GPT-4o不相上下。OpenAI近期也开放了ChatGPT-4o的对话功能。根据艾瑞咨询的统计,2021年对话式AI市场规模为45亿元,带动规模126亿元。预计到2026年,对话式AI市场规模将达到108亿元,带动规模超385亿元,五年复合年均增长率(CAGR)达32.5%。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 552字 | 3分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...