文章摘要
【关 键 词】 人工智能、编程竞赛、AGI测试、数学测试、代码能力
OpenAI最近公布了其下一代人工智能模型o3,该模型在多个领域取得了显著成绩。在CodeForces编程竞赛中,o3的分数超过了2700,这一成绩在全球人类程序员中仅有不到200人能够达到。此外,在为人工通用智能(AGI)准备的ARC-AGI测试中,o3的分数从32%跃升至75.7%和87.5%,这得益于模型支持低思考程度和高思考程度两种设置。ARC-AGI测试由Keras之父François Chollet发起,主要涉及图形逻辑推理。
o3还在号称最难数学测试的EpochAI Frontier Math中取得了突破,该测试包含最新的未公开前沿题目。o3在测试中的得分从2分提升至25分,而人类专业数学家解决其中一道题目需要数小时到数天,o3仅需几分钟即可完成。
同时,OpenAI还公布了o3-mini模型,该模型支持低、中、高三种思考程度设置,主要展示了其代码能力。在低设置下,o3-mini与o1-mini表现相当,而在中高设置下,o3-mini已经超过了o1正式版。
北大校友任泓宇,作为GPT-4o的核心开发者和GPT-Next项目组成员,现场展示了o3-mini的编程能力。他使用特殊版本的ChatGPT,称为ChatGPT α,完成了一个复杂的编程任务,o3-mini仅用38秒就完成了思考并成功运行代码。
o3和o3-mini目前处于早期预览状态,安全研究者可以在OpenAI官网申请早期访问权限。任泓宇的参与和展示进一步证实了华人在OpenAI核心项目中的重要角色。
原文和模型
【原文链接】 阅读原文 [ 953字 | 4分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★☆☆☆☆