模型信息
【模型公司】 百川智能
【模型名称】 Baichuan2-53B
【摘要评分】 ★★★★★
文章摘要
【关 键 词】 3D生成模型、AI、Stability AI、VAST、Transformer架构
文章主要介绍了3D生成模型TripoSR的相关内容。TripoSR是由Stability AI和华人团队VAST联合推出的3D生成模型,能够在0.5秒内将单张图片转化为一个几何结构完整、材质纹理清晰的3D模型,无需任何prompt和专业知识,甚至不需要依赖GPU。
TripoSR的灵感来源于2023年11月Adobe提出的LRM。和Sora作为视频生成模型使用的Transformer架构相似,TripoSR和LRM都基于Transformer架构。这种方法将图像生成3D模型的任务理解为一场跨维度的语言翻译。
尽管LRM在超过百万级别的公开三维数据集上接受了训练,但其代码和模型并未对外开放,且训练成本较高,需要128块A100 GPU连续运行一周,这使得许多资源有限的研究团队望而却步。
TripoSR的出现填补了3D生成式人工智能领域的一个关键空白。该模型基于LRM的原始算法,通过精细筛选和渲染的Objaverse数据集子集以及一系列的模型和训练改进,显著提高了从有限训练数据中泛化的能力,同时也增强了3D重建的保真度。
此外,文章还介绍了Tripo AI的背景。Tripo AI背后是一个叫作VAST AI Research的新锐3D研究机构,自2023年底相继开源了Wonder3D、CSD、TGS等工作的代码和权重,获得了开源社区的广泛好评。
原文信息
【原文链接】 阅读原文
【阅读预估】 1318 / 6分钟
【原文作者】 量子位
【作者简介】 追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...