
文章摘要
在2025中关村论坛上,智源研究院发布了跨本体具身大小脑协作框架RoboOS和开源具身大脑RoboBrain,标志着单机智能向群体智能的迈进。RoboOS通过模块化设计和智能任务管理,支持多机器人系统的跨本体协作,实现了从单机智能到群体智能的跃迁。RoboBrain作为具身大脑,具备任务规划、可操作区域感知和轨迹预测的三维能力,能够将抽象指令映射为具象动作序列,增强长程操作任务的能力。
RoboBrain由基座模型、A-LoRA模块和T-LoRA模块组成,采用多阶段训练策略,具备长历史帧记忆和高分辨率图像感知能力。在任务规划、可操作区域感知和轨迹预测评测任务中,RoboBrain表现出卓越性能,优于GPT-4V、Claude3等领先的闭源/开源MLLMs。RoboBrain能够解读人类指令和视觉图像,生成基于实时图像反馈的行动计划和评估,预测每一步的轨迹并感知相应的可操作区域。
RoboOS基于「大脑-小脑」分层架构,通过共享记忆系统实现多个机器人之间的状态同步与智能协作,突破传统「信息孤岛」限制。RoboOS动态管理多机器人任务队列,支持优先级抢占与资源优化分配,确保复杂场景下实时响应,实现高并发任务调度。此外,RoboOS基于执行反馈动态调整策略,结合环境变化,持续优化任务规划,提升鲁棒性,做到实时闭环优化。
在「递送苹果和水果刀」的任务场景中,基于RoboOS及RoboBrain,睿尔曼单臂机器人、宇树人形G1和松灵双臂机器人分工协作,展示了跨本体协作的高效性。RoboOS原生支持异构机器人本体的灵活接入,以Profile模板机制快速完成机器人能力建模与适配。本体的小脑模块可调用包括开源技能库、自研低阶控制器等多种技能接口,形成一个支持模块复用、即插即用的运行体系,大幅降低开发门槛与接入成本。
RoboOS提供完备的模型适配与API接入能力,兼容自研的多模态VLM,作为可插拔的大脑决策引擎,支撑复杂任务的多机协作需求。借助RoboOS的端云一体化协同能力与动态调度机制,整个系统具备高度的扩展性与可迁移性,为未来具身智能的规模部署与生态构建奠定了通用操作系统级的基础。
RoboOS基于智源研究院研发的并行训练与推理框架FlagScale,原生支持多机器人系统的端云协同能力,打造具身智能的统一底座。系统在设计上充分考虑「多机器人-多模态-多任务」场景,具备极高的可扩展性与低时延响应能力。面向机器人在长期运行中产生的海量感知与行为数据,RoboOS提供基于内存优化的数据访问引擎,支持TB级别历史数据的内存随机访问能力,为任务复现、异常回溯、跨任务知识迁移等场景提供基础能力。
智源研究院依托多模态大模型技术优势资源,联合北大、清华、中科院等高校院所以及银河通用、乐聚、加速进化、宇树等产业链上下游企业,积极建设具身智能创新平台。此次发布的RoboOS及RoboBrain将有机融合和广泛链接不同构型的具身本体与丰富多元的具身模型,加速具身智能跨本体协作与规模化应用。开放、协作、共享,是具身智能生态繁荣的必经之路,智源研究院愿携手更多产业合作伙伴,共绘具身智能生态蓝图。
原文和模型
【原文链接】 阅读原文 [ 2845字 | 12分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★