首个转型AI公司的新势力,在全球AI顶会展示下一代自动驾驶模型

首个转型AI公司的新势力,在全球AI顶会展示下一代自动驾驶模型

 

文章摘要


【关 键 词】 智能驾驶大模型算力自动驾驶技术创新

小鹏汽车近期在智能驾驶领域取得显著进展,其全球首款L3级算力AI汽车G7正式亮相,搭载三颗自研图灵AI芯片,有效算力超过2200TOPS,并首次部署了VLA+VLM视觉大模型这一技术突破标志着端到端智能驾驶进入新阶段,通过大算力、大模型和大数据的结合,为行业迈向L3级自动驾驶铺平道路。G7的智驾大脑与小脑VLA-OL模型首次引入“运动型大脑”的决策能力,而VLM模型则作为车辆理解世界的核心,未来将支持本地聊天、主动服务等多语言交互功能。

在CVPR 2025大会上,小鹏作为唯一受邀的中国车企,展示了其自动驾驶基座模型的技术细节。该模型在复杂城市环境中展现出拟人化驾驶能力,如正确变道绕行、避让侵入车辆和逆行自行车等。基座模型以720亿参数规模为核心,通过2000万条视频片段训练,具备视觉理解、链式推理(CoT)和动作生成能力,强化学习进一步提升了泛化性能。其CoT能力使AI能像人类一样进行逻辑推理,处理训练中未见的“长尾场景”,显著提升安全性和可解释性。

小鹏采用“云端大模型+车端蒸馏”的技术路线,通过知识迁移将基座模型压缩至车端算力范围,同时保持核心性能。团队开发的强化学习奖励模型聚焦安全、效率和合规三大原则,将人类驾驶经验转化为AI训练标准。此外,正在研发的世界模型计划用于实时环境模拟,构建闭环反馈网络以持续优化基座模型。这种内外循环的迭代机制(云端训练与车端数据回流)使系统具备持续进化能力,与Yann LeCun提出的“世界模型是AGI关键”理念高度契合。

小鹏验证了自动驾驶领域的Scaling Laws(扩展定律),证明模型规模、数据量和算力的同步扩展能显著提升复杂场景处理能力。其万卡智算集群(10 EFLOPS算力)支持五天一次的快速迭代,GPU利用率达行业顶尖的85%。通过定制AI编译器、硬件协同设计等技术,车端token处理量被压缩70%,最大化发挥了自研图灵芯片的效能。这一全链路优化体系从AI基础设施层面重构了自动驾驶开发范式,其经验也被应用于机器人、飞行汽车等新领域。

小鹏的实践表明,转型为AI公司需长期投入大规模算力与数据基础设施。相比大语言模型,自动驾驶基座模型面临多模态数据处理、物理世界认知等更复杂挑战。随着端到端技术和世界模型的发展,智能驾驶正从“规则编码”转向“自主推理”,未来或推动更多通用化AI能力的诞生。何小鹏透露G7年内将推出重大新功能,进一步展现技术迭代速度。这一进程不仅重新定义了“AI汽车”的能力边界,也为行业提供了规模化落地的参考路径。

原文和模型


【原文链接】 阅读原文 [ 4314字 | 18分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...