OpenAI 发布最新模型 o1，这次变为华人扛大旗？一分钟搞出 3D 版贪吃蛇，好用但小贵

AIGC动态1年前 (2024)发布 ai-front

2,789 0 0

OpenAI 发布最新模型 o1，这次变为华人扛大旗？一分钟搞出 3D 版贪吃蛇，好用但小贵

文章摘要

OpenAI于9月12日推出了名为“草莓”（Strawberry）的o1模型，这是其推理模型家族的首个成员，旨在解决科学、编码和数学等领域的复杂问题，这些问题对于现有AI模型来说难以攻克，包括OpenAI自家强大的GPT-4o模型。o1模型通过推理拆解问题，模仿人类的思维步骤来得出正确结果，与GPT-4o相比，虽然价格更高、生成速度较慢，但提供了更深入的解决方案。

o1模型的编码和数理能力显著提升，有用户在社交平台上展示了其在一分钟内创建3D版贪吃蛇游戏的能力。此外，还有用户通过结合o1和Cursor Composer，在10分钟内为iOS创建了一个带有动画的完整天气应用程序。o1模型在解决美国数学邀请赛（AIME）的问题时，正确率高达83.3%，远超GPT-4o的13.4%。在Codeforces在线编程竞赛中，o1模型的排名位于参赛者中的第89百分位。

OpenAI还推出了更小、更便宜的o1-mini版本，适用于需要推理但不需要广泛世界知识的应用程序。o1模型的推理界面能够展示模型的思考过程，如“我很好奇”、“我正在认真思考”等，营造出模型在分步推理的感觉。OpenAI的研究负责人Jerry Tworek指出，o1模型使用了一种全新的优化训练算法和定制的训练数据集，通过强化学习技术训练模型自主解决问题。

尽管o1模型在某些方面表现出色，但也存在局限性，例如无法浏览网页或接收上传的文件和图像。在定价方面，o1模型的费用大约是GPT-4o的3.5倍。OpenAI计划将o1-mini的访问权限向全体ChatGPT用户免费开放，但具体发布日期尚未确定。o1模型背后的研究团队中，有多位华人开发者的贡献。

OpenAI的首席技术官Mira Murati表示，公司正在构建下一代主模型GPT-5，它将在体量上远超前身，并可能融入推理技术。新模型的发布标志着生成式AI在方法论层面的转变，展示了AI模型不偏离正确行为轨道的能力。其他竞争对手如谷歌也在进行类似的研究，而OpenAI的研究副总裁Mark Chen认为，新推理方法表明推进AI发展并不一定需要耗费大量算力。