像Sora一样，用物理模拟方式生成视频

129 0 0

文章摘要

由麻省理工学院等顶尖高校联合研发的PhysDreamer（PD）模型，通过物理模拟技术实现了高保真3D交互视频生成。该模型能够精准捕捉物体在物理交互中的细微动态变化，例如触碰花朵后花瓣的摆动轨迹与衰减过程，其核心在于将视频生成模型与物理材质属性评估相结合，无需真实材质数据即可推断物体动力学特征。

PD的视频生成模块采用编码器-解码器架构，通过分析海量视频数据建立场景外观与动力学的关联。编码器提取视频帧的低维特征表示，解码器则重构出逼真视频序列。该模块包含四大核心技术：外观建模通过纹理、颜色等特征编码物体形态变化；动力学建模解析运动轨迹中的速度与加速度规律；先验知识提取建立外力作用与物体弹性等物理属性的关联；响应预测则结合交互刺激生成新动态，形成完整的物理交互闭环。

在物理仿真层面，PD创新性地引入材质场表示技术，使用隐式神经场为3D对象每个空间点分配杨氏模量参数。这种可微分模型通过优化匹配参考视频动态，实现了虚拟物体变形、回弹等行为的物理精确模拟。例如虚拟花朵受挤压时，其形变过程与真实材质特性高度吻合，突破了传统方法对预设物理参数的依赖。

实验数据显示，PD在缓慢运动表征方面显著优于DreamGaussian4D等主流模型，其优势源于对长时程动态衰减过程的精细建模。该技术为虚拟现实、影视特效等领域提供了新范式，通过物理规律驱动的视频生成机制，使合成内容既符合视觉真实性又遵循自然物理法则。研究团队开源模型的决策，将进一步加速3D交互内容生成技术的生态发展。