OpenAI 突然推送推送高级语音模式「Her」,又抢了谷歌风头

AIGC动态2个月前发布 geekpark
344 0 0
OpenAI 突然推送推送高级语音模式「Her」,又抢了谷歌风头

 

文章摘要


【关 键 词】 Google新模型价格降低性能提升高级语音AI竞争

9月25日,Google宣布了两款新模型Gemini-1.5-Pro-002和Gemini-1.5-Flash-002的发布。Gemini Pro是Google系列模型中的中等规模模型,对付费用户开放,而Gemini Flash则是由Gemini Pro模型蒸馏而来,用户可以免费使用,并且开发者有一定额度的免费API使用权。此次更新的重点是价格降低超过50%,1.5 Flash的速率限制提高了2倍,1.5 Pro的速率限制提高了约3倍,输出速度提高2倍,延迟降低3倍,过滤器切换为选择加入。

Google的Gemini Pro模型价格显著下降,输入token价格降低64%,输出token价格降低52%,增量缓存token价格降低64%,适用于小于128K token的提示语,新价格将从2024年10月1日起生效。此外,1.5 Flash的速率限制从1000 RPM提高到2000 RPM,1.5 Pro的速率限制从360 RPM提高到1000 RPM,这些变化将在接下来的几周内生效。Google 1.5 Flash的输出速度提高了2倍,延迟降低了3倍。Google表示,发布的Gemini模型默认不会应用过滤器,开发者可以根据用例自行配置。Gemini模型在数学、长上下文窗口和视觉方面取得了进步,在MMLU-Pro基准测试中性能提升了约7%,在数学和HiddenMath基准测试中进步约20%,视觉和代码使用场景也有所提升。

同时,OpenAI在同一天宣布,其高级语音模式将对Plus和Team用户推出。高级语音模式的发布一再推迟,直至Google更新模型,OpenAI立刻表示将在本周内推出语音模型。高级语音模式与人类在对话中的反应时间相近,会变换语调,增加了个性化指令功能,可以直接指令模型说话说慢点或用特定口音,同时可以记住用户的名字和提前提供的信息给出更个性化的回复。

OpenAI的高级语音功能今日起推出,将向订阅用户推出,周内会全量进行推送。高级语音将以蓝色旋转球表示,并增加5个新语音。用户可以自定义指令,让模型以某种口音发音、记住事件以及用户想要如何被称呼等。高级语音对话目前仅适用于ChatGPT Plus和Team帐户的用户,免费用户仍然可以访问标准语音模式。Plus和Team用户每天有高级语音的使用限制,并且每日限制可能会发生变化。

此次Gemini的发布是由Google的Logan Kilpatrick主要负责对外沟通交流,他曾是OpenAI的前开发者关系负责人,于2024年跳槽至Google。OpenAI此次宣布的时间点或许还有另外一个意义——此前外媒报道称,Meta公司本周将在Meta AI中推出名人语调的音频对话功能。在硅谷,AI的竞争仍在继续。

豆包-智能助手

原文和模型


【原文链接】 阅读原文 [ 2156字 | 9分钟 ]
【原文作者】 极客公园
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明

相关文章

暂无评论

暂无评论...