谷歌推出通用AI代理：能自动执行600多种动作，游玩复杂3D游戏

AIGC动态1年前 (2024)发布 AIGCOPEN

1,945 0 0

谷歌推出通用AI代理：能自动执行600多种动作，游玩复杂3D游戏

文章摘要

【关键词】 DeepMind、通用AI、3D环境、SIMA、游戏操作

该文章介绍了谷歌DeepMind推出的一种面向3D环境的通用AI代理SIMA，该代理无需访问游戏源代码或定制API，只需输入图像和简单自然语言文本指令即可执行各种游戏操作。研究人员与8个游戏工作室合作，在知名复杂3D游戏中测试了SIMA的性能，结果显示SIMA可以执行600多种基本操作，每个动作大约在10秒内完成。SIMA的总体架构由多种大模型组成，包括视觉感知模型、大语言模型、建模规划模型和控制执行模型，使其能够像人类一样思考、规划和执行任务。数据收集和预处理是SIMA的核心模块之一，研究人员从商业游戏等环境搜集了海量数据，并进行了清洗、转换和标准化操作，以帮助SIMA更好地学习游戏中的物体、动作和交互。未来，研究人员计划持续迭代SIMA的通用代理能力，希望在实际生活中帮助用户做更多事情。

原文和模型

【原文链接】 阅读原文 [ 1402字 | 6分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 gpt-3.5-turbo-0125
【摘要评分】 ★☆☆☆☆

OpenAI ChatGPT

ChatGPT是OpenAI公司开发的一种大型语言模型。它是一种基于Transformer架构的深度学习模型，可以对语言进行建模和生成。它可以处理问答、对话生成、文本生成等多种任务。

# AIGC动态 # 图像生成 # 大模型 # 3D环境 # AIGC开放社区 # DeepMind # gpt-3.5-turbo-0125 # OpenAI # SIMA # 游戏操作 # 通用AI

© 版权声明

文章版权归作者所有，未经允许请勿转载。

“绘蛙”

相关文章

OpenAI新Agent套件全解析，以及发布会没说的30+要点

Founder Park

520

英伟达推出NIM，可优化推理以实现大规模AI模型部署

AIGC开放社区

2,104

GPT搜索引擎原型曝光！新模型GPT4-Lite驱动，虽然鸽了发布会但代码已上传

量子位

3,026

强化学习让大模型自动纠错，数学、编程性能暴涨，DeepMind新作

机器之心

2,195

“程序员将消失”，李彦宏/黄仁勋都赞同，三大方向可“自救”

admin

2,502

OpenAI联合创始人兼首席科学家，官宣离职

AIGC开放社区

2,645

“极客训练营”

暂无评论

暂无评论...