文章摘要
【关 键 词】 OpenAI、GPT-4o、人工智能、语音交互、技术创新
摘要:
近期,关于OpenAI即将发布重大更新的报道引起了广泛关注。尽管有传言称该公司计划推出Google搜索的竞争对手,但OpenAI的首席执行官Sam Altman否认了这些传言,并暗示公司正在开发一些令人兴奋的新产品。
OpenAI正式宣布了其新旗舰模型GPT-4o,这是一款免费的生成式人工智能模型,将在未来几周内逐步推出。GPT-4o提供了与GPT-4相当的智能水平,但在文本、视觉和音频方面进行了改进。该模型能够通过语音、文本和视觉进行推理,并且添加了新技术以提高与ChatGPT的对话速度。
OpenAI首席技术官Muri Murati在主题演讲中提到,GPT-4o在语音模式背后加入了新技术,使得人们可以使用麦克风与ChatGPT进行交流。此外,GPT-4o不仅能够将语音转换为文本,还能理解和标记音频的其他功能,如呼吸和情感。它还具有先进的音频理解能力,并可以控制其声音。
GPT-4o在50种语言中的速度更快,可能使用了与GPT-4加速日语的技术相同的方法。OpenAI还发布了ChatGPT的桌面版本和更新的用户界面。研究员William Fedus表示,GPT-4o是OpenAI最先进的模型,它在更难的提示集上,特别是编码方面,实现了显著的性能提升。
Sam Altman在推特上表示,GPT-4o是OpenAI最好的模型。在API中,GPT-4o的价格是GPT-4-turbo的一半,速度是其两倍,且有5倍的速率限制。此次发布与以往不同,OpenAI决定允许所有人使用这项新技术。
在发布会上,演示者展示了GPT-4o在数学问题解决、语音交互和情感调整方面的能力。此外,GPT-4o还能够检查和解释代码,展示了其在多个领域的应用潜力。
尽管之前有许多关于OpenAI发布会内容的猜测,但GPT-4o的发布超出了所有人的预期。Sam Altman在接受媒体采访时表示,他愿意不惜一切代价致力于构建通用人工智能(AGI),并认为开发AGI的任何成本都是合理的。
最后,文章还推荐了《2024年第1季度中国大模型季度监测报告》和即将于5月17日开幕的AICon全球人工智能开发与应用大会,这些活动将探讨AI大模型的最新发展和应用。
原文和模型
【原文链接】 阅读原文 [ 3139字 | 13分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★