图灵诺奖得主等大佬齐聚海淀！清华版Sora震撼首发，硬核AI盛会破算力黑洞

AIGC动态1年前 (2024)发布 AIera

1,807 0 0

文章摘要

在2024年中关村论坛年会的“人工智能主题日”上，一系列重要的人工智能技术成果被发布，其中包括由生数科技联合清华大学发布的最新视频大模型“Vidu”。Vidu以其出色的人物和场景时间一致性、长达16秒的视频生成能力以及逼真的视觉效果，被认为是国产Sora模型中的佼佼者，能够全面对标国际先进的视频模型。

Vidu的特点包括模拟真实物理世界、富有想象力、理解多镜头语言、一镜到底的16秒时长、超强时空一致性以及对中国文化元素的理解。这些特点使得Vidu在视频生成领域具有显著的优势，能够在无需插帧、剪切的情况下，直接实现端到端的视频生成。

除了Vidu，北京智源人工智能研究院与中国电信人工智能研究院（TeleAI）还联合发布了全球首个低碳、高性能、低幻觉多语言大模型Tele-FLM。Tele-FLM在2T token的数据上进行训练，用时2个月，具有520亿参数。值得注意的是，Tele-FLM的训练仅使用了896×A800的算力，远低于Meta3的Llama 3-70B模型可能使用的近5万块H100。此外，Tele-FLM在训练过程中对数据质量进行了严格把控，尤其是在中文数据方面，虽然只占30%，但其中文能力已经明显超越了对标的模型。

这些成果的发布不仅展示了中国在人工智能领域的技术进步，也体现了中国科研团队在原创技术研究和多语言大模型开发方面的实力。同时，这些技术的开源策略也有助于推动全球人工智能技术的发展和应用。