“谷歌版Sora”被嘲画质好糊,但在世界模拟器上又前进了一步

AI-Agent9个月前发布 QbitAI
756 0 0

模型信息


【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆

作者信息


【原文作者】 量子位
【作者简介】 追踪人工智能新趋势,关注科技行业新突破
【微 信 号】 QbitAI

“谷歌版Sora”被嘲画质好糊,但在世界模拟器上又前进了一步
 

文章摘要


【关 键 词】 Genie交互式虚拟世界AIDeepMind动作模型

谷歌DeepMind团队推出了一个名为Genie交互式虚拟世界生成模型,它拥有110亿参数。

Genie的特点是能够从单张图像出发,生成可交互的2D虚拟世界,而且这个虚拟世界是自主可控的。

尽管Genie在画质上存在不足,只能以1FPS的速度制作游戏,但其创新性在于能够推断动作并用正确动作驱动世界模型。

Genie的训练过程是无监督的,使用了超过200,000小时的互联网游戏视频数据集。

Genie包含三个关键组件:潜在动作模型(LAM)、视频分词器和潜在动态模型。

用户可以通过潜在动作与生成的环境进行交互,创造出新的、动态的视频内容。

尽管目前Genie的demo时长较短,画质有待提高,但其潜力巨大,被认为是实现通用Agent的基石之作。

Genie的研究团队成员包括多位在机器学习和AI领域有显著贡献的科学家。

原文信息


【原文链接】 阅读原文
【原文字数】 1961
【阅读时长】 8分钟

© 版权声明

相关文章

暂无评论

暂无评论...