李飞飞看中的万亿赛道,中国首个自研空间智能AI登场!单张图即生3D世界

AIGC动态1周前发布 AIera
222 0 0
李飞飞看中的万亿赛道,中国首个自研空间智能AI登场!单张图即生3D世界

 

文章摘要


【关 键 词】 空间智能3D生成交互视频AI模型技术创新

昆仑万维正式发布全自研的Matrix-Zero世界模型,标志着中国在空间智能领域取得突破性进展。该模型包含3D场景生成与可交互视频生成两大核心功能,支持单张图片输入即可生成360度可自由探索的3D场景,并实现实时交互的视频生成,为游戏、影视、具身智能等领域带来革新潜力。

在3D场景生成技术中,模型通过自研的布局生成与纹理生成模块,结合可微渲染和扩散模型技术,解决了传统2D工具物理不合理、视角受限等问题。动态光照、海浪、云雾等效果严格遵循真实物理规律,支持任意角度长距离探索与风格迁移,显著提升了场景构建效率。其创新性的实时补全机制,确保用户在移动视角时场景几何与纹理始终保持一致,突破了现有3D工具仅能生成孤立物体的局限。

交互视频生成功能依托双模型架构实现突破:视频生成模型采用Transformer扩散架构增强时序连贯性,用户交互模型通过离散运动控制、连续视角追踪等模块解析指令。用户通过键盘或鼠标操作可实时操控视频视角变化,生成内容与交互意图高度契合,这在电影镜头设计、游戏场景开发等场景中展现出显著优势。相比同类产品,Matrix-Zero在开放环境下的探索范围与画面稳定性达到行业领先水平。

空间智能的突破标志着AI从二维认知向三维理解的跃迁。李飞飞提出的空间智能理念在该技术中得到实践,不仅要求AI感知三维世界,还需植入几何与物理规则实现推理能力。尽管谷歌Genie 2、World Labs等产品已布局该领域,昆仑万维通过独特的全产业链布局,将3D生成与交互控制深度整合,在商业应用层面形成差异化优势。技术测试显示,其生成的科幻场景交互效果已接近电影《黑客帝国》的虚拟世界呈现水平。

从产业影响看,该技术可使游戏场景建模成本降低90%,影视特效制作效率提升5倍以上。案例数据显示,传统电影单镜头VFX成本高达百万美元级,而Matrix-Zero可实现秒级生成。昆仑万维的全矩阵技术布局为其奠定领先地位——自2020年启动AGI战略以来,已构建覆盖文本、图像、3D、视频、音乐的五大模型体系,天工系列大模型在多模态基准测试中屡获突破。

空间智能的演进将推动多模态AI向更高维度发展。未来技术方向包括跨模态物理规律迁移、时空信息深度融合,以及在教育、医疗等领域的扩展应用。随着Matrix-Zero计划于2024年4月上线,其商业化进程或将重新定义内容创作范式,加速虚实融合的数字化进程。

原文和模型


【原文链接】 阅读原文 [ 4057字 | 17分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek-r1
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...