李飞飞看中的万亿赛道，中国首个自研空间智能AI登场！单张图即生3D世界

2,096 0 0

文章摘要

昆仑万维正式发布全自研的Matrix-Zero世界模型，标志着中国在空间智能领域取得突破性进展。该模型包含3D场景生成与可交互视频生成两大核心功能，支持单张图片输入即可生成360度可自由探索的3D场景，并实现实时交互的视频生成，为游戏、影视、具身智能等领域带来革新潜力。

在3D场景生成技术中，模型通过自研的布局生成与纹理生成模块，结合可微渲染和扩散模型技术，解决了传统2D工具物理不合理、视角受限等问题。动态光照、海浪、云雾等效果严格遵循真实物理规律，支持任意角度长距离探索与风格迁移，显著提升了场景构建效率。其创新性的实时补全机制，确保用户在移动视角时场景几何与纹理始终保持一致，突破了现有3D工具仅能生成孤立物体的局限。

交互视频生成功能依托双模型架构实现突破：视频生成模型采用Transformer扩散架构增强时序连贯性，用户交互模型通过离散运动控制、连续视角追踪等模块解析指令。用户通过键盘或鼠标操作可实时操控视频视角变化，生成内容与交互意图高度契合，这在电影镜头设计、游戏场景开发等场景中展现出显著优势。相比同类产品，Matrix-Zero在开放环境下的探索范围与画面稳定性达到行业领先水平。

空间智能的突破标志着AI从二维认知向三维理解的跃迁。李飞飞提出的空间智能理念在该技术中得到实践，不仅要求AI感知三维世界，还需植入几何与物理规则实现推理能力。尽管谷歌Genie 2、World Labs等产品已布局该领域，昆仑万维通过独特的全产业链布局，将3D生成与交互控制深度整合，在商业应用层面形成差异化优势。技术测试显示，其生成的科幻场景交互效果已接近电影《黑客帝国》的虚拟世界呈现水平。

从产业影响看，该技术可使游戏场景建模成本降低90%，影视特效制作效率提升5倍以上。案例数据显示，传统电影单镜头VFX成本高达百万美元级，而Matrix-Zero可实现秒级生成。昆仑万维的全矩阵技术布局为其奠定领先地位——自2020年启动AGI战略以来，已构建覆盖文本、图像、3D、视频、音乐的五大模型体系，天工系列大模型在多模态基准测试中屡获突破。

空间智能的演进将推动多模态AI向更高维度发展。未来技术方向包括跨模态物理规律迁移、时空信息深度融合，以及在教育、医疗等领域的扩展应用。随着Matrix-Zero计划于2024年4月上线，其商业化进程或将重新定义内容创作范式，加速虚实融合的数字化进程。