文章摘要
【关 键 词】 DeepMind、通用AI、3D环境、SIMA、游戏操作
该文章介绍了谷歌DeepMind推出的一种面向3D环境的通用AI代理SIMA,该代理无需访问游戏源代码或定制API,只需输入图像和简单自然语言文本指令即可执行各种游戏操作。研究人员与8个游戏工作室合作,在知名复杂3D游戏中测试了SIMA的性能,结果显示SIMA可以执行600多种基本操作,每个动作大约在10秒内完成。SIMA的总体架构由多种大模型组成,包括视觉感知模型、大语言模型、建模规划模型和控制执行模型,使其能够像人类一样思考、规划和执行任务。数据收集和预处理是SIMA的核心模块之一,研究人员从商业游戏等环境搜集了海量数据,并进行了清洗、转换和标准化操作,以帮助SIMA更好地学习游戏中的物体、动作和交互。未来,研究人员计划持续迭代SIMA的通用代理能力,希望在实际生活中帮助用户做更多事情。
原文和模型
【原文链接】 阅读原文 [ 1402字 | 6分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 gpt-3.5-turbo-0125
【摘要评分】 ★☆☆☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...