机器人安卓时刻!行业首个通用具身智能平台亮相,国家队全程真机直播

AIGC动态12小时前发布 AIera
50 0 0
机器人安卓时刻!行业首个通用具身智能平台亮相,国家队全程真机直播

 

文章摘要


【关 键 词】 具身智能机器人通用平台智能系统多场景

全球首个支持多本体多场景应用的通用具身智能平台「慧思开物」近日发布,标志着具身智能从「功能机」迈向「智能机」时代的里程碑突破。该平台由北京人形机器人创新中心推出,旨在解决传统机器人开发模式中存在的碎片化、泛化性难的问题,为机器人赋予跨场景、跨本体的智能化能力。「慧思开物」通过统一架构,如同安卓系统为智能手机提供通用操作系统一样,打破了传统机器人开发模式,实现了多本体兼容、多场景适应和强大泛化能力。

发布会现场展示了搭载「慧思开物」平台的各构型机器人,完成了工业分拣、积木搭建、桌面整理、物流打包四大场景任务,展现了自然语言理解、视觉理解、空间感知、复杂任务理解、任务精准拆解、工具调用、双臂协作、毫米级精度操作、自主纠错、实时重规划执行等方面的惊人进化。「慧思开物」作为全球首个「一脑多能」、「一脑多机」的通用具身智能平台,颠覆了基于单一场景单一任务做专项开发的传统机器人应用开发模式。

平台的核心架构分为具身大脑和具身小脑两大部分,具身大脑在云端运行,具备自然交互、空间感知、意图理解、分层规划和错误反思等能力;具身小脑则聚焦在端侧,负责端到端执行任务。这种分布式多具身智能体的架构,使得「慧思开物」能够实现从任务规划到技能执行的完整任务闭环。

在工业分拣场景中,操作人员通过「慧思开物」App轻点几步,几分钟内便完成了工业分拣机器人的任务设计开发与实际运行,展现了平台的简便易用性能。这种「App+机器人」模式显著降低了使用门槛,为工业自动化领域提供了便捷、高效、智能的解决方案。

积木搭建场景则展示了「慧思开物」在复杂任务智能化拆解与执行方面的领先能力。通过视觉大模型(VLM)对积木样例进行拆解,精确规划每一层的搭建顺序,准确拾取相应积木,并按次序完成了3层积木的毫米级精准搭建。这一过程真实展现了大模型思维链能力,以及强大的拟人交互能力、视觉语言理解能力、空间解析能力和精细化操作能力。

桌面整理场景中,「天工」机器人完美实现了双臂协同桌面流畅整理,面对多次随机的人为打断或移位干扰,依然能够精准识别桌面物品并实时反应、动态调整、自主重试。这一能力得益于北京人形机器人自研的端到端VLA模型,以及自监督数据过滤框架(SSDF)的应用,显著提高了机器人在高不确定性环境中的表现。

物流打包场景则展示了「天工」机器人对长序列复杂任务的理解与执行能力,以及灵巧手在工具使用与精细操作中的优势。通过离散化隐动作空间,机器人能够有效区分不同任务的动作模式,显著提升了其在动态环境中的适应能力和复杂任务执行能力。

拟人移动场景中,「天工」机器人通过基于状态记忆的预测型强化模仿学习方法,实现了拟人感知行走,在复杂地形中依然能够步伐稳健平稳移动。这一技术不仅保证了机器人直膝拟人步态,还增强了整体动作的协调性,使机器人行走的节奏更加从容、自然。

「慧思开物」的推出,不仅填补了具身智能在通用软件系统方面的空白,还为机器人行业提供了从任务理解到操作执行的全流程数据支持。随着平台的逐步开源开放,相信机器人将能更好地适应千变万化的现实环境,真实走进千家万户,赋能千行百业。

原文和模型


【原文链接】 阅读原文 [ 5108字 | 21分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...