下注端到端：一场具身智能的谨慎豪赌

1,540 0 0

文章摘要

在2024年世界机器人大会（WRC）上，人形机器人以其操作能力的提升成为焦点，体现了人类对通用机器人终极形态的向往。在具身智能时代，除了机器人的外形，更重要的是实现智能，这涉及到软件与硬件的耦合。具身智能领域的团队在技术路径上有不同的选择，主要分为端到端的暴力美学和分层决策两种方法。

端到端架构通过单一神经网络将任务目标直接转化为控制信号，如特斯拉的Optimus机器人和谷歌的RT-2项目。这种模型虽然强大，但需要大量数据和算力，对小规模团队来说成本过高。此外，端到端模型的决策速度可能较慢，限制了其在实际场景中的应用。

分层决策模型则将任务分解为多个层级，分别训练不同的神经网络，最终整合。这种方法的优点是即时性高、可解释性和可控性强，且训练单个模型所需的数据量相对较少。Figure AI的Figure 02就是分层决策模型的代表，其输出频率高达200Hz，执行动作的延时只有5ms。

在具身智能的发展中，「大脑」和「小脑」的概念被引入，分别负责高层次的认知或决策问题和基础层面的功能性问题。具身智能的「大脑」涉及感知和规划决策系统，而「小脑」则负责将决策转换为动作指令并执行。

具身智能的实现不仅依赖于技术路径的选择，还面临数据质量和数量的挑战。不同的团队在解决这一问题上采取了不同的策略，如通过仿真数据、模拟器、Sim2Real等方法来提高数据的质量和数量。

总的来说，具身智能的发展正处于一个快速变化的阶段，无论是端到端的暴力美学还是分层决策架构，都需要不断地探索和优化。随着技术的进步，未来可能会有更多的创新和突破。

原文和模型

【原文链接】 阅读原文 [ 5491字 | 22分钟 ]
【原文作者】 AI科技评论
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

Moonshot AI

月之暗面是一家 AI 初创大模...

# AIGC动态 # 大模型 # 机器人 # 人形机器人 # 具身智能 # 分层决策 # 技术路径 # 端到端

文章版权归作者所有，未经允许请勿转载。

具身智能构型之争：人形、灵巧手、双足，谁是最终 C 位？

AI科技评论

1,851

离开优必选的日子

AI科技评论

1,888

现场削黄瓜、叠衣服，曾爆火的刮胡子机器人再进化，穹彻的具身智能大脑来了！

机器之心

2,156

春晚BOT扭秧歌的科技“秘籍” | 文末赠书

AI前线

871

宇树科技王兴兴：与其完善多模态大模型，不如探索开发全新模型

admin

2,556

清华团队破解具身智能Scaling Law，GPT时刻在即！宁德时代联创终于出手

新智元

1,847

暂无评论

暂无评论...

下注端到端：一场具身智能的谨慎豪赌

文章摘要

原文和模型

大语言模型如何助力药物开发? 哈佛 George Church Lab 最新综述

OpenAI开启推理算力新Scaling Law，AI PC和CPU的机会来了

相关文章

暂无评论

热门网址

热门文章

下注端到端：一场具身智能的谨慎豪赌

文章摘要

原文和模型

大语言模型如何助力药物开发? 哈佛 George Church Lab 最新综述

OpenAI开启推理算力新Scaling Law，AI PC和CPU的机会来了

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章