清华大学获X-Embodiment最佳论文奖，机器人顶会CoRL 2024获奖名单出炉

2,157 0 0

文章摘要

清华大学高阳团队在CoRL 2024会议上获得X-Embodiment Workshop最佳论文奖，其获奖论文《Data Scaling Laws in Imitation Learning for Robotic Manipulation》探讨了机器人操作中模仿学习的数据规模定律，特别是数据规模对零样本泛化的影响。研究团队通过收集超过40,000次演示和15,000多次机器人实测，发现策略泛化能力依赖于环境和对象的多样性。他们提出了一种高效的数据收集方案，仅需四个采集者一下午就能获取足够数据，使两个任务在新环境和新对象上的成功率达到约90%。此外，团队还在多种野外环境中部署机器人，验证了模型在全新环境中的泛化能力。

实验设计方面，研究团队使用手持夹持器（UMI）收集人类演示数据，并采用扩散策略（Diffusion Policy）建模，研究策略泛化性能如何随训练环境数量、物体数量和演示数量变化。实验任务包括对象泛化、环境泛化和跨环境对象泛化，通过随机选择部分演示进行训练，并评估策略在未知情况下的表现。结果显示，策略泛化能力与训练物体数量、环境数量和训练环境-物体对数关系密切，符合幂律分布。

论文作者包括高阳及其学生林凡淇、胡英东、盛平岳、Chuan Wen、游嘉诚，他们均来自清华大学交叉信息研究院。高阳博士主持具身视觉与机器人实验室（EVAR Lab），专注于利用人工智能技术赋能机器人，致力于打造通用的具身智能框架。其他获奖论文包括Kuo-Hao Zeng等人的《PoliFormer: Scaling On-Policy RL with Transformers Results in Masterful Navigators》和Franck Djeumou等人的《One Model to Drift Them All》。