标签:FrontierMath

陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年

Epoch AI联合六十余位全球数学家推出了全新的数学基准FrontierMath,旨在评估AI系统的高级推理能力。该基准包含数百个原创且极具挑战性的数学问题,覆盖从奥...