谷歌发最强“世界模型”Genie 2,OpenAI抢风头,要连办12天发布会

AIGC动态1周前发布 Si-Planet
133 0 0
谷歌发最强“世界模型”Genie 2,OpenAI抢风头,要连办12天发布会

 

文章摘要


【关 键 词】 AI新品3D世界虚拟互动智能体训练动态场景

Google DeepMind 最新发布了新一代大规模基础世界模型 Genie 2,该模型能够从单张图像生成一个高度多样化、逻辑严谨且连贯一致的 3D 世界,并支持长达一分钟的持续互动。Genie 2 相较于上一代 Genie 模型,在交互时长和复杂性上都有显著提升,能够模拟虚拟世界中多种行为结果,如跳跃、游泳等,并展现出物体交互、复杂角色动画、物理效果等能力。用户可以通过文本描述和渲染效果选择来创建全新的虚拟世界,并与其中的角色和环境进行互动。

Genie 2 的设计目的在于为通用智能体提供无限多样的动态场景,用于训练和评估,推动机器人技术和虚拟助手等领域的发展。对于艺术家和设计师而言,Genie 2 可以将概念艺术和草图转化为完全可交互的虚拟环境,提升创意流程的效率。在智能体训练方面,Genie 2 能够生成丰富多样的虚拟环境,包括智能体从未见过的新任务场景,为智能体的任务执行和环境适应能力提供重要的测试场景。

Genie 2 是一个自回归的潜在扩散模型,基于大量视频数据训练,通过自动编码器将视频帧转换为潜在帧,然后传递给大规模Transformer动态模型进行预测。在推理阶段,Genie 2 可以逐帧生成画面,并根据之前的动作和画面来决定接下来的内容。

与此同时,OpenAI 宣布将开启12天活动,每个工作日都会进行一场直播,带来发布会或演示,内容涵盖重磅发布和一些小彩蛋。这引发了业界对接下来可能发布的 AI 新品的广泛猜测和期待。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 2174字 | 9分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...