清华大学获X-Embodiment最佳论文奖,机器人顶会CoRL 2024获奖名单出炉
文章摘要
【关 键 词】 模仿学习、机器人操作、数据规模、泛化能力、人工智能
清华大学高阳团队在CoRL 2024会议上获得X-Embodiment Workshop最佳论文奖,其获奖论文《Data Scaling Laws in Imitation Learning for Robotic Manipulation》探讨了机器人操作中模仿学习的数据规模定律,特别是数据规模对零样本泛化的影响。研究团队通过收集超过40,000次演示和15,000多次机器人实测,发现策略泛化能力依赖于环境和对象的多样性。他们提出了一种高效的数据收集方案,仅需四个采集者一下午就能获取足够数据,使两个任务在新环境和新对象上的成功率达到约90%。此外,团队还在多种野外环境中部署机器人,验证了模型在全新环境中的泛化能力。
实验设计方面,研究团队使用手持夹持器(UMI)收集人类演示数据,并采用扩散策略(Diffusion Policy)建模,研究策略泛化性能如何随训练环境数量、物体数量和演示数量变化。实验任务包括对象泛化、环境泛化和跨环境对象泛化,通过随机选择部分演示进行训练,并评估策略在未知情况下的表现。结果显示,策略泛化能力与训练物体数量、环境数量和训练环境-物体对数关系密切,符合幂律分布。
论文作者包括高阳及其学生林凡淇、胡英东、盛平岳、Chuan Wen、游嘉诚,他们均来自清华大学交叉信息研究院。高阳博士主持具身视觉与机器人实验室(EVAR Lab),专注于利用人工智能技术赋能机器人,致力于打造通用的具身智能框架。其他获奖论文包括Kuo-Hao Zeng等人的《PoliFormer: Scaling On-Policy RL with Transformers Results in Masterful Navigators》和Franck Djeumou等人的《One Model to Drift Them All》。
原文和模型
【原文链接】 阅读原文 [ 2437字 | 10分钟 ]
【原文作者】 AI科技评论
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆