文章摘要
【关 键 词】 AI语音助手、ChatGPT演示、GPT-4升级、多模态模型、技术竞争
OpenAI即将在下周一(13日)上午10点(太平洋时间)进行线上直播,届时将展示全新的ChatGPT demo演示和GPT-4升级更新。尽管之前有关于GPT-5和搜索引擎的传闻,但官方已确认这些并不存在。然而,OpenAI正在开发一款全能的AI语音助手,预计将在直播中展示。这款AI语音助手能够通过声音和文本与人交流,识别不同人的语调、语气,以及物体和图像。
OpenAI的CEO Altman曾表示,他们希望开发出一款能像人类一样交流的AI,类似于电影《Her》中的虚拟助手。新模型将具备音频输入、音频输出功能,以及更好的推理能力,在某些查询上甚至超过了GPT-4 Turbo。OpenAI已经向一些客户展示了这项新技术,并计划在下周一的活动中首次公开展示。
尽管谷歌预计在14日召开I/O大会,但OpenAI的直播时间安排得非常及时,似乎是为了抢占先机。在Altman宣布不会发布搜索引擎后,谷歌的股价立即上涨。OpenAI的AI助手虽然体积较大,无法在个人终端设备上运行,但客户可以在短期内使用基于云的版本来增强OpenAI已经支持的软件功能,如自动客户服务智能体。
OpenAI已经开发了用于转录音频(Whisper)和文本转语言(TTS)的模型,这些能力被集成在ChatGPT背后。新模型将这些能力整合到一个模型中,打造一个“原生多模态模型”,在理解图像和音频方面表现更佳,响应速度也更快。
作为OpenAI的合作伙伴,微软预计将利用OpenAI的新技术升级自己的语音助手,并尝试压缩技术以适应包括配备前置摄像头的可穿戴设备。虽然尚不清楚OpenAI何时会向付费客户提供这些新功能,但最终目标是将其纳入ChatGPT的免费版本中。新模型在回答某些问题上表现得更好,但仍然会出现“幻觉”。
关于GPT-5的发布,目前计划在年底前进行。尽管官方已确认没有GPT-5,但OpenAI仍在不断探索和开发新的AI技术,以实现更加智能和人性化的交互体验。
原文和模型
【原文链接】 阅读原文 [ 4530字 | 19分钟 ]
【原文作者】 新智元
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★