
文章摘要
过去一年,行业在讨论大模型创新时,主要集中在推理能力和多模态融合等领域,尤其是文本生成图片和视频的新技术。全球范围内,OpenAI、Google、Anthropic等公司动作频繁,国内的阿里、腾讯、字节、快手、DeepSeek、MiniMax等企业也积极跟进,竞争激烈。然而,腾讯在3D生成领域的深耕却显得尤为突出。尽管腾讯在热门领域也有布局,但其在3D生成方面的进展却鲜为人知,直到最近才被行业注意到。
腾讯通过其混元3D模型,在3D生成领域取得了全球领先的成就。在2025年的CVPR会议上,腾讯开源了混元3D 2.1大模型,涵盖了模型权重、训练代码和数据处理流程的全链路开源。这一举措使得混元3D在Hugging Face上迅速登上3D模型类目的榜首,显示出其行业影响力。在此之前,行业内缺乏真正可用且完全开源的3D生成大模型,尽管Google和OpenAI等公司进行过技术探索,但效果有限且未完全开源,导致实际应用困难。
腾讯的混元3D模型从初代版本开始就展现了强大的能力。2024年11月发布的初代版本能够通过文本或图片自动生成3D模型,并自动绑定骨骼和生成简单动画,大大节省了开发者的时间。腾讯在当时就完整地开源了模型,为3D生成领域带来了惊喜。随后,2025年1月发布的2.0版本在文本理解和几何精度上有了显著提升,生成的3D模型形状和细节更加准确,几何生成方面实现了质的突破。
腾讯还推出了混元AI 3D创作引擎,进一步推动了3D生成的应用。该引擎不仅能够生成三维模型,还提供了编辑和工作流定制功能,类似于3D创作场景的Midjourney或Sora。2025年3月,腾讯开源了五个基于Hunyuan3D-2.0的衍生版本,针对不同使用场景进行了优化。4月发布的2.5版本在几何精度、细节密度和贴图质量上有了明显提升,生成的3D模型轮廓更准、细节更丰富,并支持高清纹理和凹凸贴图,光影和材质的真实感也大幅提升。
最近发布的混元3D 2.1版本融合了PBR纹理生成技术,进一步提升了3D模型的光影、材质和表面细节的还原度。这一技术突破使得生成的3D模型能够直接用于游戏、影视和虚拟场景等下游应用,减少了后期美术团队的重复劳动。腾讯在3D生成领域的成功,得益于其将技术与业务紧密结合,特别是在游戏领域的深厚积累。
腾讯在3D生成领域的每一步都紧贴实际需求,模型质量的提升直接优化了游戏团队的生产效率和成本。与单纯的技术炫技不同,腾讯的3D生成技术具有实际应用价值,能够为内容产业带来显著变革。随着3D生成技术的不断突破,腾讯有望在未来的内容产业拐点中成为关键变量,推动行业的进一步发展。
原文和模型
【原文链接】 阅读原文 [ 2492字 | 10分钟 ]
【原文作者】 AI产品阿颖
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★