20万卡吞金兽 Grok 3 炸裂登场，卡帕西大神亲测：性能超过DeepSeek R1！马斯克：短期不开源

1,745 0 0

文章摘要

埃隆·马斯克旗下的人工智能公司xAI正式发布新一代AI模型Grok 3及其迷你版本Grok 3-mini，宣称这是迄今为止最强大的AI模型。Grok 3的核心突破在于首次将推理能力整合到模型中，通过”思维链”机制使模型在解决问题前进行深度思考。为支持模型训练，xAI在214天内分两阶段建成20万张英伟达GPU集群，较前代Grok 2的1.5万GPU实现了数量级跨越，总训练算力达到4亿GPU小时，远超OpenAI GPT-4和DeepSeek-V3的公开数据。

在性能表现方面，Grok 3在数学、科学和编码领域均展现显著优势。2024年美国数学邀请考试（AIME）中取得93%的准确率，创下当前模型最高纪录。其迷你版本Grok 3-mini虽参数规模较小，但在部分场景中表现甚至优于主模型，尤其在历史考试内容处理上展现出更强的适应性。多模型对比测试显示，Grok系列在Arena众包测试中首次突破1400分阈值，全面超越OpenAI、DeepSeek等竞争对手。

技术架构层面，Grok 3引入DeepSearch工具，被定义为新型搜索引擎与智能代理的融合体，不仅支持专业领域的代码编写，还能处理日常问题解答。模型计划通过X平台Premium+订阅和年费300美元的SuperGrok服务开放访问，并承诺在未来数月内开源Grok 2代码库，但Grok 3的核心训练细节仍将保密。

关于Scaling Law的行业争议，Grok 3的发布被视为重要验证案例。通过20万GPU集群训练的超大规模模型，xAI试图证明算力扩展仍能持续提升模型性能。对比数据显示，其训练资源投入量是GPT-4的12.8倍（按H100等效计算），DeepSeek-V3的143倍。马斯克预测该技术路线将在两年内实现计算机全面超越人类能力，并应用于特斯拉制造、太空发射等复杂工程场景。

市场布局方面，xAI宣布成立游戏工作室，现场演示了利用Grok 3融合《俄罗斯方块》与《宝石迷阵》的创作能力。尽管存在实时数据偏差争议和市场份额劣势（ChatGPT占据62.5%市场），Grok系列凭借社交媒体X的原生集成优势，在实时信息处理和个性化交互方面形成差异化竞争力。不过，行业观察指出其参数规模仍落后于主流模型，且训练成本过高可能限制商业化扩展。

Grok系列的发展历程揭示了xAI的技术演进路径：从Grok 1的合成数据验证，到Grok 2的多模态尝试，直至Grok 3的推理能力突破。虽然前两代产品因应用限制未能撼动市场格局，但本次发布的20万GPU集群训练体系和深度推理架构，标志着AI模型开发进入超大规模算力支撑的新阶段。随着语音模式上线和企业API的逐步开放，Grok 3能否实现马斯克”两年内登顶AI巅峰”的预言，将成为行业持续关注的焦点。