比 Sora DiT 架构早两个月的 U-ViT,由这家中国 AIGC 公司提出
模型信息
【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★★★★
文章摘要
摘要总结:
本文主要介绍了国内AIGC创业公司生数科技在多模态大模型领域的成就和技术创新。生数科技的U-ViT技术与OpenAI的Sora在架构上具有相似之处,但U-ViT比DiT早两个月提出。尽管Sora在全球范围内产生了巨大影响,但生数科技依然在多模态大模型领域取得了显著成果。
生数科技的UniDiffuser模型基于Diffusion Transformer架构,与Stable Diffusion在参数量和训练数据规模上相当。UniDiffuser支持图文任务,包括图生文、图文联合生成和改写等多种功能。此外,生数科技还推出了视觉创意设计平台PixWeaver和3D资产创建工具VoxCraft,分别支持AI生图、AI生视频和高精度3D模型生成。
生数科技的技术团队在底层算法原始创新方面取得了显著成果,包括无训练推理框架Analytic-DPM和多模态基础大模型UniDiffuser。Analytic-DPM通过蒙特卡洛方法和预训练的基于得分模型来估计方差和KL散度,显著提高了模型的采样效率。UniDiffuser在大规模图文数据集LAION-5B上训练,实现了基于一个底层模型的多种生成任务。
生数科技坚持原生多模态大模型路线,致力于提升对开放域下复杂交互场景的信息生成能力。公司已完成数亿元融资,成为国内多模态大模型赛道的最高融资额。生数科技CEO唐家渝表示,公司将承担引领国内底层技术创新的角色,即使在Sora的影响下,国内的多模态大模型仍具有发展空间。
原文信息
【原文链接】 阅读原文
【阅读预估】 2374 / 10分钟
【原文作者】 AI科技评论
【作者简介】 雷峰网旗下AI新媒体。聚焦AI前沿研究,关注AI工程落地。