OpenAI正式发布o3 – 通往AGI的路上，已经没有了任何阻碍。

1,999 0 0

文章摘要

OpenAI在12天的直播中发布了其最新的人工智能模型OpenAI o3，标志着该公司在人工智能领域的又一重大进步。o3在多个评测集上展现出卓越的性能，包括软件工程考试SWE-Bench Verified中的71.7%成绩，超越了o1；在Codeforces编码竞赛平台中得分2727，位列第175名，超越了99.99%的人类。在数学竞赛AIEM 2024中接近满分，而在博士级科学考试GPQA Diamond中也显示出显著的进步。特别值得注意的是，在FrontierMath数学基准测试中，o3达到了25.2%的成功率，远高于其他模型。在ARC-AGI基准测试中，o3的得分达到了87.5%，接近人类的85%阈值，显示出在抽象和推理任务上的巨大进步。

尽管o3的性能令人印象深刻，但目前仅对红队开放，普通用户暂时无法使用。OpenAI还基于o3训练了三个小尺寸模型，其中o3-mimi预计在1月底对外开放。作者对2025年AI行业的进化充满期待，认为推理模型、Agent、AI硬件和世界模型将是未来发展的重点。这12天的直播虽然只有少数几天带来了惊喜，但o3的发布弥补了之前的不足，为AI领域带来了新的高光时刻。