模型信息
【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆
作者信息
【原文作者】 量子位
【作者简介】 追踪人工智能新趋势,关注科技行业新突破
【微 信 号】 QbitAI
文章摘要
【关 键 词】 Genie、交互式虚拟世界、AI、DeepMind、动作模型
谷歌DeepMind团队推出了一个名为Genie的交互式虚拟世界生成模型,它拥有110亿参数。
Genie的特点是能够从单张图像出发,生成可交互的2D虚拟世界,而且这个虚拟世界是自主可控的。
尽管Genie在画质上存在不足,只能以1FPS的速度制作游戏,但其创新性在于能够推断动作并用正确动作驱动世界模型。
Genie的训练过程是无监督的,使用了超过200,000小时的互联网游戏视频数据集。
Genie包含三个关键组件:潜在动作模型(LAM)、视频分词器和潜在动态模型。
用户可以通过潜在动作与生成的环境进行交互,创造出新的、动态的视频内容。
尽管目前Genie的demo时长较短,画质有待提高,但其潜力巨大,被认为是实现通用Agent的基石之作。
Genie的研究团队成员包括多位在机器学习和AI领域有显著贡献的科学家。
原文信息
【原文链接】 阅读原文
【原文字数】 1961
【阅读时长】 8分钟
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...