千寻智能解浚源:具身智能的 Scaling Law 已跨过起跑线丨具身先锋十人谈

文章摘要
【关 键 词】 机器人、具身智能、数据采集、硬件迭代、成本控制
首届“人形机器人半程马拉松”在北京亦庄举办,标志着具身智能领域从实验室走向真实场景的试炼。尽管赛道火热,但具身智能的规模仍处于Scaling Law的早期阶段,制约其发展的并非算力和资本,而是硬件迭代的客观周期。解浚源,千寻智能具身智能部负责人,强调了硬件迭代的重要性,并认为在中国强大的供应链体系支撑下,具身智能每年都能上一个数量级。
解浚源的职业生涯跨越了深度学习框架、系统研发、推荐系统优化、联邦学习平台搭建等多个领域,最终选择加入具身智能赛道。他认为,机器人快速发展的时刻即将来临,而端到端的VLA(Vision-Language-Action)技术路线已经收敛,未来将进入Scaling阶段。VLA技术通过端到端的训练,让机器人模仿人类行为,展现出显著的性能提升。
数据采集是机器人技术最核心的难点,涉及物理世界的复杂性和多样性。解浚源指出,机器人数据的采集需要高效管理供应链和数采员,确保数据的多样化,避免重复采集导致的数据效率下降。千寻智能在VLA Spirit v1中展示了机器人叠衣服的高成功率,背后是工业化数据采集pipeline的支撑,体现了工程化落地的核心能力。
具身智能的落地场景分为短期、中期和长期三个阶段。短期内,工厂是主要的落地场景;中期来看,服务业如物流、商场货架上货、酒店服务等具有更大的机会;长期愿景则是十年后,10%的人拥有一台家用机器人。解浚源认为,真机数据采集相较于仿真具有成本优势,特别是在中国强大的供应链支持下,一万台机器人的成本低于一万块H100显卡,更有利于大规模量产推广。
数据壁垒和数据飞轮是具身智能与大模型的主要区别。大模型缺乏数据壁垒,预训练数据来自公开网络,容易被蒸馏走,而机器人数据是私有采集的,形成数据壁垒。此外,机器人一旦在某个场景落地,就能一边盈利一边收集更多数据,形成数据飞轮,这与互联网的商业模式相似。解浚源强调,具身智能处于Scaling Law的早期阶段,未来性能进步的空间巨大,而大模型在摩尔定律进步之前处于末期,需要等待更长时间才能实现规模提升。
原文和模型
【原文链接】 阅读原文 [ 6240字 | 25分钟 ]
【原文作者】 AI科技评论
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★