OpenAI o1模型问世，五级AGI再突破！推理极限超博士，清北复旦华人立功

2,295 0 0

文章摘要

OpenAI最近推出了o1系列模型，包括o1-preview和o1-mini，这些模型在复杂推理、数学和编程问题上展现出了显著的性能提升。o1-preview模型将向ChatGPT的Plus和Team用户以及API的tier 5开发者推出，而o1-mini则是一种经济高效的推理模型，特别擅长STEM领域，如数学和编码。

o1模型在首次使用时给人留下深刻印象，尽管存在一些缺陷和局限性。在一系列基准测试中，o1的性能超过了GPT-4o，甚至在某些领域达到了人类博士水平。例如，在AIME数学竞赛中，o1-mini的成绩高于60%，显示了其在数学领域的强大能力。然而，尽管o1模型在某些方面表现出色，但在其他方面，如解决黎曼假说或理解某些逻辑问题时，仍有改进空间。

o1模型的成功部分归功于强化学习算法，这使得模型能够像人类一样思考问题，并通过训练完善思维过程。OpenAI的研究员Jason Wei提到，o1不是简单地通过提示完成链式思考，而是通过强化学习训练模型，以更好地执行这一过程。

在推理Scaling方面，o1模型展示了新范式，即推理不需要巨大的模型，而是将大量计算从预训练/后训练转移到推理服务。这表明OpenAI可能已经发现了推理scaling法则，而学术界最近才开始关注这一点。

o1模型在多个基准测试中的表现超越了GPT-4o，包括在Codeforces、AIME和GPQA Diamond等挑战性任务上。在编程竞赛中，基于o1的进一步训练模型在2024年国际信息学奥林匹克竞赛中表现出色，甚至在放宽提交限制的情况下超过了金牌门槛。

尽管o1模型在推理能力更重要的领域得到了人们的青睐，但在自然语言任务中，GPT-4o仍然更受欢迎。这表明o1-preview并不适合所有使用场景，但o1-mini因其高性价比而在特定领域表现出色。

o1系列模型的开发团队包括了来自不同背景的专家，如Ilya Sutskever、Hongyu Ren、Jason Wei、Kevin Yu、Shengjia Zhao、Wenda Zhou、Francis Song和Mark Chen等，他们在推理研究和技术安全方面做出了重要贡献。这些专家的加入，以及他们在OpenAI的工作，为o1模型的成功奠定了基础。