机器人版的「斯坦福小镇」来了，专为具身智能研究打造

AIGC动态1年前 (2024)发布 almosthuman2014

3,028 0 0

文章摘要

上海人工智能实验室OpenRobotLab等机构的研究者创建了一个名为GRUtopia的虚拟小镇，旨在解决具身智能领域数据稀缺的问题。这个虚拟环境是首个专为各种机器人设计的模拟互动3D社会，包含10万个交互式场景和89种不同的场景类别。项目主要包括：

1. 场景数据集GRScenes：包含10万个交互式、精细注释的场景，可自由组合成城市规模的环境。与以往主要关注家庭的工作不同，GRScenes涵盖了89种不同的场景类别，弥补了服务型环境的空白。

2. GRResidents：这是一个大型语言模型（LLM）驱动的非玩家角色（NPC）系统，负责社交互动、任务生成和任务分配，从而模拟具身AI应用的社交场景。

3. 基准GRBench：支持各种机器人，但侧重于作为主要智能体的有腿机器人，并提出了涉及物体定位导航、社交定位导航和定位操纵的中等难度任务。

GRUtopia的构建包括以下几个关键步骤：

1. 收集约10万个高质量的合成场景，进行清理、语义注释，并组合成城镇，作为机器人的基本游乐场。

2. 对场景中的3D物体进行修改，创建完整的物体，使它们能够以物理上可信的方式进行交互，并为所有物体的交互部件附加细粒度部件标签。

3. 对场景和对象进行语言注释，考虑不同粒度的场景元素，如对象与区域的关系，并设计用户界面进行区域注释。

4. 构建世界知识管理器（WKM），用于管理虚拟环境知识，并向NPC提供高级场景知识。WKM从数据集和模拟器后台获取分层注释和场景知识，构建场景图作为场景表示。

5. 设计基于LLM的规划器，由存储模块、LLM程序员和LLM发言器组成，用于NPC的决策过程。

作者在GRUtopia中进行了对象指代、语言grounding和以对象为中心的QA等方面的实验，验证了NPC框架在不同LLM中的准确性。此外，GRBench作为一个评估具身智能体的基准，包括物体定位导航、社交定位导航和定位操作三个基准，用于评估机器人智能体处理日常任务的能力。

定量评估结果表明，使用大型模型作为后端的智能体框架在所有三个基准测试中都表现出更好的整体性能。定性评估结果展示了LLM智能体在社交定位导航任务中与NPC互动的过程，证明了NPC能够为研究人与机器人的互动和协作提供自然的社会互动。

GRUtopia的构建为具身AI研究提供了一个高质量的数据平台，缓解了数据稀缺的问题，并为具身智能体的评估提供了更全面的基准。这项工作有望推动具身智能领域的发展。

原文和模型

【原文链接】 阅读原文 [ 3465字 | 14分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆

Moonshot AI

月之暗面是一家 AI 初创大模...

# AIGC动态 # 大模型 # 机器人 # 数据平台 # 智能评估 # 机器人研究 # 社交互动 # 虚拟小镇

文章版权归作者所有，未经允许请勿转载。

「摸鱼」被踢，GPT-4o真不行！30天筹款破万，AI真人秀太上头

新智元

578

世界模型版《模拟人生》：AI虚拟小人街头演讲拉票，GPT-4o选举获胜

机器之心

277

在机器人顶会 RSS 2024 上，中国的人形机器人研究斩获最佳论文奖

机器之心

2,727

Kimi挣钱的路子好抽象…

量子位

3,004

提供具身智能训练场，北电数智以“星火智算+”打通数据和场景

AI前线

1,063

“键盘敲出火星子了”！小红书 IT 团队加班承接 TikTok 这波泼天流量，这款 AI 搜索还趁机火了

AI前线

1,510

暂无评论

暂无评论...

机器人版的「斯坦福小镇」来了，专为具身智能研究打造

文章摘要

原文和模型

Coatue 重磅报告：具身智能不会有 ChatGPT 时刻

GPT-4o mini，你好！GPT-3.5 彻底再见！｜AI 鲜测

相关文章

暂无评论

热门网址

热门文章

机器人版的「斯坦福小镇」来了，专为具身智能研究打造

文章摘要

原文和模型

Coatue 重磅报告：具身智能不会有 ChatGPT 时刻

GPT-4o mini，你好！GPT-3.5 彻底再见！｜AI 鲜测

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章