OpenAI押注的「1X」训出专用世界模型,首证机器人Scaling Law

OpenAI押注的「1X」训出专用世界模型,首证机器人Scaling Law

 

文章摘要


【关 键 词】 人形机器人虚拟模拟AI学习物理预测技术挑战

1X公司,一家挪威人形机器人制造商,最近推出了NEO Beta,一款专为家庭设计的双足人形机器人。该公司由OpenAI领投,专注于开发高仿真人形机器人NEO和商用轮式人形机器人EVE。1X公司最近开发了一种世界模型,这是其机器人的虚拟模拟器,基于视频生成和自动驾驶世界模型的技术进展。

1X的人工智能副总裁Eric Jang透露,公司一直在开发一个通用机器人的学习模拟器,现在已经完成。工程师Daniel Ho指出,这个机器人世界模型能够理解物理世界并生成高保真视频,使机器人能够在神经空间中进行规划、评估和模拟操作。这些生成的视频片段与真实视频非常相似,以至于难以区分。

1X的创始人兼CEO Bernt Bornich将这一成就视为人形机器人数据显著增强扩展定律的证据。网友对这一机器人世界模型给予了高度评价,有人甚至将其与《西部世界》相提并论。

1X的世界模型能够从相同的起始图像序列出发,根据不同的机器人动作建议想象出多种未来。它还能预测物体的相互作用、掉落物体的影响、部分可观测性、可变形物体和铰接物体的行为。

世界模型解决了构建通用机器人时的一个实际挑战,即评估。在不断变化的环境中,评估多任务系统的性能变得复杂。1X的研究提出了一个问题:随着数据、计算和模型规模的增加,机器人的能力将如何扩展?为了迎来机器人技术的“ChatGPT时刻”,必须首先建立其扩展定律。

传统的基于物理的模拟器,如Bullet、Mujoco、Isaac Sim和Drake,是测试机器人策略的有效方法,但它们主要针对刚体动力学设计,需要大量的手工资产创作。这些模拟器在模拟家庭环境中的日常物体或宠物时存在局限性,因为这些物体很难模拟,且机器人使用的模拟环境在视觉上往往单调,缺乏现实世界用例的多样性。

1X采用了一种新方法来评估通用机器人,即直接从原始传感器数据中学习模拟器,并使用模拟器来评估新策略。这种方法允许在不手动创建资产的情况下理解真实世界的复杂性。1X在过去一年中收集了数千小时的EVE机器人数据,包括在家中和办公室执行各种任务的视频和动作数据。研究人员将这些数据结合起来,训练了一个能够根据观察和动作预测未来视频的世界模型。

该世界模型能够根据不同的动作指令产生不同的结果。在抓取盒子实验中,模型能够根据夹具的运动提升和移动盒子,而其他盒子则保持不动。即使没有提供动作,世界模型也能生成合理的视频,例如学会驾驶时应避开人和障碍物。

模型还能生成长视野视频,如完整的T恤折叠演示。然而,模型在交互过程中可能无法保持对象的形状和颜色,有时对象甚至可能会消失。此外,当对象被遮挡或以不利的角度显示时,它们的外观可能会变得扭曲。在物理定律方面,模型有时能够正确理解物理特性,如松开勺子时勺子掉到桌子上,但在许多情况下,模型生成的结果未能遵守物理定律,如盘子悬浮在空中。

最后,研究团队让EVE走到镜子前,观察它是否能够生成与镜子中动作相一致的行为。结果显示,模型开始自我反思,但没有出现自我识别或自我理解的觉醒。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 1838字 | 8分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...