谷歌推出通用AI代理:能自动执行600多种动作,游玩复杂3D游戏

AIGC动态8个月前发布 AIGCOPEN
655 0 0
谷歌推出通用AI代理:能自动执行600多种动作,游玩复杂3D游戏

 

文章摘要


【关 键 词】 DeepMind通用AI3D环境SIMA游戏操作

该文章介绍了谷歌DeepMind推出的一种面向3D环境通用AI代理SIMA,该代理无需访问游戏源代码或定制API,只需输入图像和简单自然语言文本指令即可执行各种游戏操作。研究人员与8个游戏工作室合作,在知名复杂3D游戏中测试了SIMA的性能,结果显示SIMA可以执行600多种基本操作,每个动作大约在10秒内完成。SIMA的总体架构由多种大模型组成,包括视觉感知模型大语言模型建模规划模型控制执行模型,使其能够像人类一样思考、规划和执行任务。数据收集和预处理是SIMA的核心模块之一,研究人员从商业游戏等环境搜集了海量数据,并进行了清洗、转换和标准化操作,以帮助SIMA更好地学习游戏中的物体、动作和交互。未来,研究人员计划持续迭代SIMA的通用代理能力,希望在实际生活中帮助用户做更多事情。

原文和模型


【原文链接】 阅读原文 [ 1402字 | 6分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 gpt-3.5-turbo-0125
【摘要评分】 ★☆☆☆☆

© 版权声明

相关文章

暂无评论

暂无评论...