终于来了!OpenAI开放GPT-4o高级语音,还用中文说「对不起」
文章摘要
【关 键 词】 GPT-4o、语音功能、多语言、专业配音、数据集
OpenAI公司最近推出了其高级语音功能,名为GPT-4o,该功能将向Plus和Team用户开放,但免费用户无法体验。Plus用户每月需支付20美元,而Team用户则需支付30美元,后者享有更多使用次数。OpenAI计划逐步推出访问权限,预计所有Plus用户将在秋末之前获得访问权限。新功能包括自定义指令、记忆、五种新声音和改进的口音,支持50多种语言。
在演示视频中,用户与模型进行了流畅的对话,可以随意打断聊天内容,体验接近与真人对话。GPT-4o甚至能够用流利的中文进行交流。此外,OpenAI项目主管Charlotte展示了如何通过自定义选项向ChatGPT提供个人信息,并根据这些信息获得相关建议。
OpenAI负责模型设计的Drew描述了他如何在工作中使用GPT-4o,将其视为一个能够提供信息和交流想法的“朋友”。尽管GPT-4o的发布比预期晚了半年,但用户们似乎接受了OpenAI的“道歉”。
此前,OpenAI因演示视频中的Sky声音与电影《Her》中AI恋人的声音相似而受到批评,随后删除了该声音。现在,新推出的五种声音分别命名为Arbor、Maple、Sol、Spruce和Vale,这些声音由来自世界各地的专业配音演员制作,旨在提供温暖、平易近人且具有丰富质感和语调的声音体验。
然而,这些新功能尚未在欧盟、英国、瑞士、冰岛、挪威或列支敦士登推出。OpenAI的Greg Brockman强调,高级语音功能的推出使得与ChatGPT的对话更加自然,相比之下,传统的打字输入显得不自然。
除了高级语音模式,OpenAI还发布了一个多语言大规模多任务语言理解(MMMLU)数据集,测试集包含14种语言,覆盖57个不同类别的主题,如初级知识、法律、物理、历史和计算机科学等高级专业学科。
原文和模型
【原文链接】 阅读原文 [ 1710字 | 7分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆