Grok3 来了,马斯克笑了,网站崩溃了

AIGC动态2天前发布 geekpark
151 0 0
Grok3 来了,马斯克笑了,网站崩溃了

 

文章摘要


【关 键 词】 AI技术Grok3发布基准测试智能体技术竞争

伊隆·马斯克领导的xAI团队正式发布新一代人工智能系统Grok3,宣称其综合能力达到行业领先水平。该系统包含基础模型、推理模型及首个智能体产品「Deep Search」,并预告即将推出语音模型。Grok3目前仅限X平台Premium+会员试用,订阅费用为40美元/月,但受限于价格和发布时间,初期用户反馈有限。前特斯拉自动驾驶负责人Andrej Karpathy通过内测指出,Grok3整体表现接近每月200美元的o1-pro模型,优于DeepSeek-R1和Gemini 2.0 Flash Thinking,但其智能体功能与Perplexity的「Deep Research」类似,存在信息编造风险,尚未达到OpenAI同类产品的可靠性水平。

技术层面,Grok3依托全球最大AI超级计算机Colossus完成训练,该集群配备20万个英伟达Hopper GPU。Grok3的计算能力是前代Grok-2的10倍以上,1月初完成预训练后持续通过强化学习提升推理能力。官方公布的基准测试显示,Grok3在数学、科学和编程领域全面领先,其mini版本也超过Gemini、Claude等竞品。在更具客观性的Imarena基准盲评中,Grok3以1400分创下基座模型新纪录,在风格控制、编码、创意写作等所有评测类别中均位列第一。

市场反应呈现两极分化。尽管马斯克直播演示引发访问高峰导致官网崩溃,但部分用户质疑Grok3未展现颠覆性突破。行业观察指出,20万GPU集群的算力优势尚未完全释放,当前AI行业受限于互联网数据枯竭,预训练规模效应减弱。马斯克团队透露,Grok3采用创新的合成数据训练方法,通过数据迭代实现逻辑一致性,错误数据会被系统自主识别并剔除。这种动态优化机制使其模型每小时都在升级,团队承诺一周后将发布更稳定的版本及基准测试完整数据。

竞争策略方面,xAI选择在谷歌、Anthropic和OpenAI即将发布新模型前抢占先机。马斯克强调Grok3具备「第一性原理」思考能力,其智能体产品可帮助用户节省上百小时研究时间。现场演示显示,系统能拆解复杂问题、交叉验证信息并生成深度回答,但实际效果仍需更多案例验证。行业分析师认为,马斯克通过快速部署超算集群(122天建成10万卡数据中心)展现工程执行力,同时配合舆论造势(如放出收购OpenAI传闻)扰乱对手节奏,为xAI争取发展窗口期。

原文和模型


【原文链接】 阅读原文 [ 1946字 | 8分钟 ]
【原文作者】 极客公园
【摘要模型】 deepseek-r1
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...