独家对话智元姚卯青:人形机器人走进家庭还需5年左右时间|钛媒体AGI

文章摘要
【关 键 词】 具身智能、人形机器人、技术发展、市场前景、行业趋势
随着2022年AI聊天机器人ChatGPT的全球风靡,“具身智能”和人形机器人逐渐成为前沿技术领域的焦点。与传统AI相比,“具身智能”更注重通过与环境的实时交互来获取信息,并基于这些信息进行思考、决策和行动。同时,“具身智能”还可通过经验积累和持续学习,提升行动和操作技能。数据显示,2024年中国人形机器人市场规模将达到约27.6亿元,并有望在2030年成长为1000亿元市场,预计到2035年,市场规模将达到3000亿元。目前,小米、小鹏、蚂蚁等数十家车企和科技大厂已入局这一前沿技术赛道。
智元机器人作为国内人形机器人赛道的头部企业之一,其创始人彭志辉(稚晖君)在B站拥有250多万粉丝。公司成立不到1个月就完成天使轮融资,并在年内斩获4次融资。成立仅6个月,智元便发布首款人形机器人,2024年还发布了五款商用人形机器人新品,并在去年底开源百万真实机器人数据集,年初率先达成1000台机器人量产。智元机器人目前有三条主打产品线:远征、Genie和灵犀,预计2025年下半年将发布一款面向机器人发烧友的产品X2。
智元合伙人、机器人研究院执行院长、具身业务部总裁姚卯青表示,自动驾驶与“具身智能”在底层硬件、框架和软件上有复用,但在AI模型、容忍度等层面非常不一样。姚卯青强调,机器人和“具身智能”技术需要真机训练场,并结合强化学习、大模型等技术能力,以提升人形机器人软硬件技术的发展。智元团队在真机强化学习方面取得了显著进展,是全球可能唯一在真机强化学习上做通的团队。
姚卯青指出,利用AI大模型能够助力机器人操作上手能力,加速进入工厂、零售、服务业等场景工作,长期还能进入家庭。然而,目前市场上9.9万元的机器人只具备基础运动能力,过早的价格战只会导致行业不健康。他强调,未来1-2年,人形机器人能够在局部工业场景应用落地,但机器人走进家庭还需要5年左右的时间,而机器人实现像人一样有通用能力的物理世界AGI(通用人工智能)还需要5-10年时间。
在谈到自动驾驶与“具身智能”的区别时,姚卯青表示,自动驾驶与“具身智能”在AI模型、硬件和软件上存在显著差异。车的硬件只有两个自由度,且在2D平面上运作,而机器人动辄几十个自由度,存在于3D空间中。此外,车对错误的容忍度非常低,而机器人可以在静态场景中容忍错误。因此,机器人需要使用大模型来达到更高的上限。
姚卯青还提到,智元机器人正在与阶跃星辰合作,期待其即将发布的视觉推理模型,这将为机器人复杂规划的大脑提供重要支持。智元团队在今年1月初发表了EnerVerse架构的论文,通过自回归扩散模型在生成未来具身空间的同时引导机器人完成复杂任务。这一创新性架构在提升4D生成能力的同时,实现了动作规划性能的显著突破。
关于人形机器人的未来发展,姚卯青认为,目前很多人形机器人只是在做简单的动作展示,尚未产生生产力价值。他强调,机器人必须结合强化学习技术,才能真正进入工厂应用。智元团队在真机强化学习方面已经取得了显著进展,并计划将模仿学习与强化学习相结合,以提升机器人的操作成功率和工作节拍。
姚卯青还指出,真机训练场对于机器人技术的发展至关重要。仿真器虽然能模拟很多物理现象,但难以精确模拟柔性物体接触、摩擦力等复杂情况。因此,真实世界的数据具有最高的价值,尽管其成本也更高。
在谈到中国与美国人形机器人的差距时,姚卯青表示,从硬件和算法两个角度来讲,中国与国外先进的人形机器人如特斯拉的擎天柱相比,并没有显著差距。特斯拉的人形机器人供应链也离不开中国企业的支持,中国供应链的实力已经在特斯拉新能源汽车的量产中得到了证明。
最后,姚卯青强调,人形机器人行业需要关注产品竞争力,而非过早的价格战。他认为,未来1-2年,人形机器人能够在局部工业场景应用落地,但进入家庭还需要5年左右的时间,而实现物理世界的AGI还需要5-10年时间。
原文和模型
【原文链接】 阅读原文 [ 6464字 | 26分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★