标签:动态场景

谷歌发最强“世界模型”Genie 2,OpenAI抢风头,要连办12天发布会

Google DeepMind 最新发布了新一代大规模基础世界模型 Genie 2,该模型能够从单张图像生成一个高度多样化、逻辑严谨且连贯一致的 3D 世界,并支持长达一分钟...

斯坦福、丰田最新研究,单视频合成多视角模型GCD

在AI视觉领域,重建复杂动态场景是一个极具挑战性的任务。尽管OpenAI的Sora模型能够生成长达一分钟的高质量视频,但其在没有多视角视频输入的情况下,合成动...