刚刚,OpenAI在ICPC 2025编程赛上满分登顶,Gemini也达到金牌水平

刚刚,OpenAI在ICPC 2025编程赛上满分登顶,Gemini也达到金牌水平

 

文章摘要


【关 键 词】 ICPC竞赛OpenAIGemini编程推理AI表现

OpenAIGemini 在 ICPC 2025 竞赛中表现出色,双双达到金牌水平,展现了 AI 在复杂编程推理问题上的强大能力。

ICPC 是全球历史最悠久、规模最大、最负盛名的大学级算法编程竞赛。今年 9 月 4 日在阿塞拜疆巴库举行的世界决赛,汇集了来自近 3000 所大学和 103 个国家的顶级队伍。比赛中,每支队伍需在五小时内解决一组复杂算法问题,只有完美解决方案才能得分,且用时至关重要,139 支参赛队伍中仅前四支获金牌。

OpenAI 的 AI 系统与人类顶尖选手在同等条件下竞技,面对相同赛题、5 小时时限,由本地系统实时评判。该系统由「通用推理模型集成体」构成,未针对竞赛专门优化训练。它在 5 小时内解决 12 个问题,11 个问题首次提交即正确,全场最难的最后一题经 9 次尝试后攻克,超过所有人类团队。此成果是 OpenAI 推理系统进步的里程碑,同一组模型已在 IMO 和 IOI 等竞赛证明实力。OpenAI 的 Borys Minaiev 和 Mostafa Rohaninejad 发文庆贺,他们分别在大规模推理模型开发、元学习与强化学习等领域有卓越贡献。

谷歌 Gemini 2.5 Deep Think 高级版本以远程在线环境参赛,比人类晚 10 分钟开始,5 小时内解决 10 个问题,达到金牌级别。它 45 分钟解决 8 个问题,三小时又解决 2 个,总用时 677 分钟,若与大学队伍成绩相比排名第二。尤其在半小时内解决了无大学队伍解出的 C 题,通过假设水库「优先级值」、应用极小极大定理和嵌套三分查找找到有效解决方案。据谷歌研究,类似版本在 2023 年和 2024 年总决赛也能获金牌,与全球前 20 名编程选手相当。Hanzhao (Maggie) Lin 和 Heng – Tze Cheng 等为该项目做出重要贡献。

ICPC 所需技能是科学和工程领域核心能力,AI 在此次竞赛获金牌凸显其提供创新解决方案的优势,正从信息处理工具转变为解决复杂推理问题的关键力量。

原文和模型


【原文链接】 阅读原文 [ 2505字 | 11分钟 ]
【原文作者】 机器之心
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...