伯克利罗剑岚:机器人的范式革命,藏在真实世界中丨具身先锋十人谈
文章摘要
【关 键 词】 强化学习、机器人操作、视觉策略、真机训练、AI+机器人
伯克利大学Sergey Levine团队最近发布了一项名为HIL-SERL的强化学习研究,该研究在具身智能领域引起了广泛关注。HIL-SERL框架使得研究者能够直接在现实世界中训练基于视觉的通用机器人操作策略,机器人在经过1至2.5小时的训练后,便能完成如组装主板、仪表盘和正时皮带等复杂操作任务,且成功率达到100%。这些任务还包括组装家具、煎蛋、鞭打积木和插入U盘等,即使在人为干扰下,机器人也能稳定灵活地完成任务。
此前,强化学习被批评为只能在模拟环境中改进算法性能,无法解决现实世界中真实机器人的问题。但SERL系列的工作证明了真机RL的可行性,强化学习不仅能够应用于现实世界,而且在精准灵巧的操作任务上效果极佳,远超模仿学习方法,节拍数平均快了1.8倍。HIL-SERL是SERL的升级版,结合了人类的示范和纠正来训练强化学习策略,专注于相对困难的任务,并解决了双臂协调或动态操作的问题。
核心作者罗剑岚,一位中国青年科学家,伯克利在读博士后,今年年初提出了高效机器人强化学习套件SERL,使机器人能在20分钟内学会装配电路板,成功率同样是100%。HIL-SERL的效果超出了罗剑岚和导师Sergey Levine的预料,Sergey对罗剑岚说:“你真的让强化学习跑起来了。”
罗剑岚在伯克利机械工程系读机器人控制博士期间,开始探索Robotics+AI,并在Pieter Abbeel的指导下攻读计算机系硕士。他一直坚信机器人的真机RL是一个长期命题,一旦克服,将对机器人学习的突破产生范式般的变革。2020年博士毕业后,罗剑岚加入了谷歌,在DeepMind、Everyday Robot与Google X等部门工作,学习了更多从底层动力学到上层控制的机器人系统知识,并一直坚持探索机器人与强化学习的结合。2022年,他回到伯克利,在Sergey Levine团队当博士后,继续探索真机RL,并取得了SERL系列工作的突破性成果。
原文和模型
【原文链接】 阅读原文 [ 6031字 | 25分钟 ]
【原文作者】 AI科技评论
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆