标签:多模态信号

清华、华为等提出iVideoGPT:专攻交互式世界模型

近年来,生成模型在视频生成领域取得了显著进展,尤其在无监督方式学习以构建预测世界模型方面。这些模型能积累关于世界如何运作的常识性知识,并预测智能体...