o3来了！编程跻身人类全球前200，破解陶哲轩说难的数学测试，北大校友任泓宇现身直播间

2,429 0 0

文章摘要

OpenAI最近公布了其下一代人工智能模型o3，该模型在多个领域取得了显著成绩。在CodeForces编程竞赛中，o3的分数超过了2700，这一成绩在全球人类程序员中仅有不到200人能够达到。此外，在为人工通用智能（AGI）准备的ARC-AGI测试中，o3的分数从32%跃升至75.7%和87.5%，这得益于模型支持低思考程度和高思考程度两种设置。ARC-AGI测试由Keras之父François Chollet发起，主要涉及图形逻辑推理。

o3还在号称最难数学测试的EpochAI Frontier Math中取得了突破，该测试包含最新的未公开前沿题目。o3在测试中的得分从2分提升至25分，而人类专业数学家解决其中一道题目需要数小时到数天，o3仅需几分钟即可完成。

同时，OpenAI还公布了o3-mini模型，该模型支持低、中、高三种思考程度设置，主要展示了其代码能力。在低设置下，o3-mini与o1-mini表现相当，而在中高设置下，o3-mini已经超过了o1正式版。

北大校友任泓宇，作为GPT-4o的核心开发者和GPT-Next项目组成员，现场展示了o3-mini的编程能力。他使用特殊版本的ChatGPT，称为ChatGPT α，完成了一个复杂的编程任务，o3-mini仅用38秒就完成了思考并成功运行代码。

o3和o3-mini目前处于早期预览状态，安全研究者可以在OpenAI官网申请早期访问权限。任泓宇的参与和展示进一步证实了华人在OpenAI核心项目中的重要角色。