钛媒体AGI独家｜智谱AI正研发对标Sora的国产文生视频模型，预计最快年内发布

AIGC动态1年前 (2024)发布 TMTPOSTAGI

2,403 0 0

钛媒体AGI独家｜智谱AI正研发对标Sora的国产文生视频模型，预计最快年内发布

文章摘要

智谱AI是国内AI领域的独角兽企业，估值超过200亿元人民币。公司正在研发一款对标美国Sora的高质量文生视频模型，预计最快年内发布。智谱AI成立于2019年，由清华大学计算机系的技术成果转化而来，创始团队均为清华大学知识工程（KEG）实验室的核心成员。

智谱AI是国内最早入局大模型赛道的公司之一，也是目前国内头部大模型厂商代表之一。2023年3月，智谱AI推出千亿开源基座对话模型ChatGLM系列，并在过去一年内完成4次升级，于2024年1月推出GLM4系列。基于全自研基座大模型的能力，智谱AI已构建了AIGC模型产品矩阵，包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。

截至2023年底，智谱AI已拥有超2000家生态合作伙伴、超1000个大模型规模化应用，另有200多家企业跟智谱AI进行了深度共创，覆盖传媒、咨询、消费、金融、新能源、互联网、智能办公等多个细分场景的多个头部企业。智谱ChatGLM-6B全球累计下载量已经超过了1300万，GitHub Star星数达到5万，整个量级超过了Meta Llama两个版本的总和。智谱AI已获得全球最受欢迎的开源机构的第五名，是全球唯一一家上榜的中国机构和组织。

融资方面，智谱AI已完成五轮融资，投资方包括君联资本、启明创投、中科创星、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构，2023年融资额超过25亿元人民币，最新一轮是2024年3月北京市人工智能产业投资基金参与投资。

智谱AI的综合能力水平接近海外顶级模型。最新基座大模型GLM-4，整体性能相比上一代大幅提升，逼近GPT-4。在中文对齐的任务下，智谱AI甚至可以略微超过GPT-4。根据最新的海外伯克利Arena Hard基准测试，GLM排名仅次于GPT-4 Turbo和Claude 3 Opus，在国内外模型中均处于领先地位。

智谱AI拥有完全自主、自研、国产化的千亿级模型算法，并实现了全栈国产化，从底层到模型层、应用层、应用接口PaaS层等实现全栈的自主研发。在整个大模型体系中，除了语言模型，还有文生图模型、图生文模型、代码模型等多种模型。与目前全球最先进的OpenAI相比，其模型种类跟它形成了一一对标。

智谱AI正在研发的文生视频模型发展突破的关键包括技术路线选择、训练所用的高质量视频素材语料两个方面。技术路线上，Transformer与Diffusion的结合架构如何在效率和效果上进行优化，如何解决连续帧之间的抖动问题，如何在满足高分辨率的同时实现高一致性的长序列生成，如何获取高质量数据泛化到更多更细节的真实场景，都是技术上需要解决和通过大量实验试错的问题。数据集方面，公司会注重更全面的优质数据版权与使用。

值得注意的是，智谱AI投资的生数科技与清华大学联合发布中国首个长时长、高一致性、高动态性视频大模型Vidu，被称为“国内首个Sora级视频模型”，也是中国首个纯自研视频大模型。一旦智谱也发布类似的文生视频模型的话，智谱AI或将与被投公司生数科技产生竞争关系。

据钛媒体AGI编辑梳理，截止目前，智谱AI以产业型投资方式，已经投资、入股超过13家AI产业链初创公司。智谱AI正在经历一个从量变到质变的过程，特别是像大模型所谓的涌现。公司目标是瞄准AGI，实现超过人类水平的超级认知智能、实现AI的自我解释、自我评测、自我监督，同时还将确保模型安全、可控。