Grok3 来了，马斯克笑了，网站崩溃了

AIGC动态1年前 (2025)发布 geekpark

2,596 0 0

文章摘要

伊隆·马斯克领导的xAI团队正式发布新一代人工智能系统Grok3，宣称其综合能力达到行业领先水平。该系统包含基础模型、推理模型及首个智能体产品「Deep Search」，并预告即将推出语音模型。Grok3目前仅限X平台Premium+会员试用，订阅费用为40美元/月，但受限于价格和发布时间，初期用户反馈有限。前特斯拉自动驾驶负责人Andrej Karpathy通过内测指出，Grok3整体表现接近每月200美元的o1-pro模型，优于DeepSeek-R1和Gemini 2.0 Flash Thinking，但其智能体功能与Perplexity的「Deep Research」类似，存在信息编造风险，尚未达到OpenAI同类产品的可靠性水平。

技术层面，Grok3依托全球最大AI超级计算机Colossus完成训练，该集群配备20万个英伟达Hopper GPU。Grok3的计算能力是前代Grok-2的10倍以上，1月初完成预训练后持续通过强化学习提升推理能力。官方公布的基准测试显示，Grok3在数学、科学和编程领域全面领先，其mini版本也超过Gemini、Claude等竞品。在更具客观性的Imarena基准盲评中，Grok3以1400分创下基座模型新纪录，在风格控制、编码、创意写作等所有评测类别中均位列第一。

市场反应呈现两极分化。尽管马斯克直播演示引发访问高峰导致官网崩溃，但部分用户质疑Grok3未展现颠覆性突破。行业观察指出，20万GPU集群的算力优势尚未完全释放，当前AI行业受限于互联网数据枯竭，预训练规模效应减弱。马斯克团队透露，Grok3采用创新的合成数据训练方法，通过数据迭代实现逻辑一致性，错误数据会被系统自主识别并剔除。这种动态优化机制使其模型每小时都在升级，团队承诺一周后将发布更稳定的版本及基准测试完整数据。

竞争策略方面，xAI选择在谷歌、Anthropic和OpenAI即将发布新模型前抢占先机。马斯克强调Grok3具备「第一性原理」思考能力，其智能体产品可帮助用户节省上百小时研究时间。现场演示显示，系统能拆解复杂问题、交叉验证信息并生成深度回答，但实际效果仍需更多案例验证。行业分析师认为，马斯克通过快速部署超算集群（122天建成10万卡数据中心）展现工程执行力，同时配合舆论造势（如放出收购OpenAI传闻）扰乱对手节奏，为xAI争取发展窗口期。