具身智能的「Z 世代」,来了

文章摘要
具身智能领域正迎来一批年轻的研究者,他们以独特的视角和创新的思维推动着这一前沿技术的发展。谭恒楷、吴铭东和王乾旭三位年轻人分别代表了具身智能研究中的不同方向与思考。他们的故事不仅展现了年轻一代在AI领域的探索精神,也揭示了具身智能技术发展中的关键挑战与未来方向。
谭恒楷,清华大学计算机系直博生,专注于具身智能中的机器人研究。他通过强化学习和扩散模型,成功开发了全球最大的diffusion policy——RDT-1B,并在机器人操作任务中取得了显著进展。然而,他意识到action数据的稀缺是具身智能的核心问题,并提出了用image space替代action space的创新思路,以克服数据不足和机器人本体异构的难题。谭恒楷的技术理想主义和对非共识的追求,使他不断探索颠覆性的技术范式,试图突破现有的技术局限。
吴铭东,北京大学图灵班成员,研究方向从生成模型转向具身智能。他通过真机强化学习(SERL)的研究,解决了机器人在真实世界中的适应性和成功率问题。吴铭东强调,强化学习是提高真实世界成功率的关键,而模仿学习则是加速强化学习的催化剂。他期待通过data flywheel式的AGI,推动具身智能在真实世界中的自我迭代。然而,他也意识到,技术落地的过程中,量产和供应链的挑战同样不容忽视。
王乾旭,北京大学计算机系学生,从物理转向计算机领域,最终投身具身智能研究。他通过蒸馏特征场(DFF)的方法,实现了机器人操作中的高维信息表示,并提出了将视觉模块与控制模块解耦的创新思路。王乾旭认为,探索不同形态机器人操作中的共性是未来研究的重要方向。他的研究不仅展现了具身智能的广阔前景,也体现了年轻研究者对技术探索的热情与执着。
三位年轻人的故事共同揭示了具身智能领域的几个关键问题:数据稀缺、技术范式创新、技术落地挑战。他们通过不同的研究路径,试图解决这些问题,推动具身智能技术的进一步发展。与此同时,他们的经历也反映了年轻一代在AI时代中的独特优势——快速的技术学习能力、对创新的敏锐嗅觉以及对未来的无限憧憬。
具身智能的未来充满机遇与挑战,而年轻的研究者们正以他们的热情与智慧,为这一领域注入新的活力。他们的探索不仅是对技术的突破,更是对AI时代人类与机器关系的深刻思考。正如谭恒楷所言,“具身靠共识是走不通的,得靠非共识才行”,年轻一代的创新精神或许正是推动具身智能走向未来的关键力量。
原文和模型
【原文链接】 阅读原文 [ 7364字 | 30分钟 ]
【原文作者】 AI科技评论
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★