杭州95后学霸坐C位,Grok 3登顶App Store!Hinton高徒、多伦多华人博士领衔

AIGC动态21小时前发布 AIera
113 0 0
杭州95后学霸坐C位,Grok 3登顶App Store!Hinton高徒、多伦多华人博士领衔

 

文章摘要


【关 键 词】 人工智能模型升级数学推理华人团队GPU集群

Grok 3的发布标志着人工智能领域进入推理智能体时代。该模型在xAI的Colossus超级计算集群上训练,运算能力达到现有顶尖模型的10倍,通过20万块GPU的算力支持,在数学、编程、知识检索等任务中实现突破性进展。其核心创新在于强化学习驱动的推理机制,允许模型进行长达数分钟的持续思考,并通过回溯机制修正错误,在2025年美国数学邀请赛测试中取得93.3%的正确率。

在技术实现层面,Grok 3展现出多维度能力跃升。数学推理方面,模型成功解决包含递归定义和极限计算的复杂问题,并推导出(1-e^(-2))/2的精确解;代码生成领域,能在6分钟内创建融合经典游戏元素的完整pygame程序,实现可视化粒子效果与交互设计;艺术创作维度,通过ASCII字符精准还原弗兰克·劳埃德·赖特建筑风格,展现对抽象概念的结构化表达能力。模型还具备100万token的上下文处理能力,在LOFT长文本基准测试中刷新纪录。

团队构成凸显华人科研力量的关键作用。Jimmy Ba作为Adam优化器发明者,将深度学习训练效率提升到新高度;95后科学家吴怀宇凭借在AlphaGeometry等项目的经验,推动模型推理架构创新。团队中还包括数学理论专家杨格、NLP领域权威戴子航等华人学者,形成跨学科的技术攻坚阵容。值得关注的是,这些研究人员多数具有Hinton、Bengio等图灵奖得主的学术传承。

技术突破背后是计算基础设施的跨越式发展。Colossus超级集群的20万GPU规模,为模型训练提供底层支撑。通过大规模强化学习策略,Grok 3在Chatbot Arena评测中获得1402的Elo评分,其mini版本在STEM任务中更实现95.8%的准确率。模型还集成DeepSearch智能体,能够实时检索网络信息并生成综合报告,标志着AI系统向主动探索型智能演进。

商业化布局方面,免费策略推动Grok迅速占领市场,上线即登顶美区应用商店榜首。即将推出的语音交互模式预计进一步拓展使用场景。技术博客披露的基准测试数据显示,模型在MMLU-Pro科学知识评估、EgoSchema视频理解等任务中均达到SOTA水平,其事实准确性较前代提升显著。随着计算集群的持续扩展,xAI计划训练更大规模模型,持续推动Scaling Law的有效性验证。

原文和模型


【原文链接】 阅读原文 [ 3497字 | 14分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek-r1
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...