具身智能GPT-2时刻到了!这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队

具身智能GPT-2时刻到了!这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队

 

文章摘要


【关 键 词】 具身智能大模型技术操作机器人泛化能力技术赋能

国内初创公司自变量机器人(X Square)专注于具身智能大模型技术,与Open AI投资的Physical Intelligence (PI)技术路线相似。该公司正在训练的Great Wall操作大模型系列的WALL-A在参数规模上已超过PI。自变量机器人的模型在处理长序列复杂任务、泛化性和通用性方面表现出色,能够实现对不规则物体的精细操作和复杂任务如折叠衣服、冲泡饮料等。WALL-A模型在多个维度上超过所有已知模型,能够完成拉拉链、扣扣子、整理衣物等精细任务,并在物理环境变量、动作模式的泛化和迁移上表现出极少样本的泛化能力

自变量机器人的WALL-A模型被定义为机器人领域的“大统一”模型,实现了端到端的纵向统一和任务的横向统一,用单一模型解决所有操作任务。该技术方向与传统机器人学习的小模型技术、以往语言、多模态大模型技术完全不同,对数据工程有更高要求,并涉及多模态和复杂的Domain Knowledge。公司创始人兼CEO王潜和联合创始人兼CTO王昊均具有强大的学术背景和行业经验,公司从成立之初就专注于端到端统一大模型技术路径。

自变量机器人认为,数据质量、多样性和量是Scaling Law中的核心要素,而统一模型是实现通用机器人的关键。公司的目标是将人类从繁琐的体力劳动中解放出来,并通过轮式机器人产品形式实现这一目标。公司计划将技术赋能其他产品,并对未来具身智能的发展持乐观态度,预计在五年到十年内会有显著进展。

豆包-智能助手

原文和模型


【原文链接】 阅读原文 [ 6607字 | 27分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆

© 版权声明

相关文章

暂无评论

暂无评论...