OpenAI重磅更新定档下周一，奥特曼暗示会有「魔法」！

AIGC动态1年前 (2024)发布 AIera

2,428 0 0

文章摘要

【关键词】 AI语音助手、ChatGPT演示、GPT-4升级、多模态模型、技术竞争

OpenAI即将在下周一（13日）上午10点（太平洋时间）进行线上直播，届时将展示全新的ChatGPT demo演示和GPT-4升级更新。尽管之前有关于GPT-5和搜索引擎的传闻，但官方已确认这些并不存在。然而，OpenAI正在开发一款全能的AI语音助手，预计将在直播中展示。这款AI语音助手能够通过声音和文本与人交流，识别不同人的语调、语气，以及物体和图像。

OpenAI的CEO Altman曾表示，他们希望开发出一款能像人类一样交流的AI，类似于电影《Her》中的虚拟助手。新模型将具备音频输入、音频输出功能，以及更好的推理能力，在某些查询上甚至超过了GPT-4 Turbo。OpenAI已经向一些客户展示了这项新技术，并计划在下周一的活动中首次公开展示。

尽管谷歌预计在14日召开I/O大会，但OpenAI的直播时间安排得非常及时，似乎是为了抢占先机。在Altman宣布不会发布搜索引擎后，谷歌的股价立即上涨。OpenAI的AI助手虽然体积较大，无法在个人终端设备上运行，但客户可以在短期内使用基于云的版本来增强OpenAI已经支持的软件功能，如自动客户服务智能体。

OpenAI已经开发了用于转录音频（Whisper）和文本转语言（TTS）的模型，这些能力被集成在ChatGPT背后。新模型将这些能力整合到一个模型中，打造一个“原生多模态模型”，在理解图像和音频方面表现更佳，响应速度也更快。

作为OpenAI的合作伙伴，微软预计将利用OpenAI的新技术升级自己的语音助手，并尝试压缩技术以适应包括配备前置摄像头的可穿戴设备。虽然尚不清楚OpenAI何时会向付费客户提供这些新功能，但最终目标是将其纳入ChatGPT的免费版本中。新模型在回答某些问题上表现得更好，但仍然会出现“幻觉”。

关于GPT-5的发布，目前计划在年底前进行。尽管官方已确认没有GPT-5，但OpenAI仍在不断探索和开发新的AI技术，以实现更加智能和人性化的交互体验。