单图0.5秒生成3D模型!Stability AI&华人团队VAST出品

AIGC动态10个月前发布 QbitAI
845 0 0

模型信息


【模型公司】 百川智能
【模型名称】 Baichuan2-53B
【摘要评分】 ★★★★★

单图0.5秒生成3D模型!Stability AI&华人团队VAST出品
 

文章摘要


【关 键 词】 3D生成模型AIStability AIVASTTransformer架构

文章主要介绍了3D生成模型TripoSR的相关内容。TripoSR是由Stability AI和华人团队VAST联合推出的3D生成模型,能够在0.5秒内将单张图片转化为一个几何结构完整、材质纹理清晰的3D模型,无需任何prompt和专业知识,甚至不需要依赖GPU。

TripoSR的灵感来源于2023年11月Adobe提出的LRM。和Sora作为视频生成模型使用的Transformer架构相似,TripoSR和LRM都基于Transformer架构。这种方法将图像生成3D模型的任务理解为一场跨维度的语言翻译。

尽管LRM在超过百万级别的公开三维数据集上接受了训练,但其代码和模型并未对外开放,且训练成本较高,需要128块A100 GPU连续运行一周,这使得许多资源有限的研究团队望而却步。

TripoSR的出现填补了3D生成式人工智能领域的一个关键空白。该模型基于LRM的原始算法,通过精细筛选和渲染的Objaverse数据集子集以及一系列的模型和训练改进,显著提高了从有限训练数据中泛化的能力,同时也增强了3D重建的保真度。

此外,文章还介绍了Tripo AI的背景。Tripo AI背后是一个叫作VAST AI Research的新锐3D研究机构,自2023年底相继开源了Wonder3D、CSD、TGS等工作的代码和权重,获得了开源社区的广泛好评。

原文信息


【原文链接】 阅读原文
【阅读预估】 1318 / 6分钟
【原文作者】 量子位
【作者简介】 追踪人工智能新趋势,关注科技行业新突破

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...