标签：OpenAI争议

OpenAI实名举报Grok3作弊，一题答64次踩着台阶和o3-mini比

Grok-3模型发布后因评估方法引发争议，OpenAI团队公开指责其测试结果存在误导性。争议焦点集中在Grok-3的AIME 2025评估图中，其柱状图浅色部分标注为Con@64成...

AIGC动态

6个月前

o3数学成绩作弊大瓜！提前让测试机构给真题，60多名数学大牛全被蒙在鼓里

OpenAI的o3模型在数学测试基准FrontierMath中的表现引发了争议。该测试基准由Epoch.ai开发，包含了60余名数学家包括陶哲轩在内的高难度题目。然而，有爆料称O...

AIGC动态

7个月前