清华特奖得主团队视频生成AI一夜刷屏！100%开源+61页技术报告，还能无限扩展生成，网友：游戏规则改变者

559 0 0

文章摘要

新国产AI视频生成模型Magi-1的发布引起了广泛关注，成为首个实现顶级画质输出的自回归视频生成模型，并且模型权重和代码完全开源。Magi-1的创新之处在于其无限长度扩展能力和对生成时长的精确控制，能够实现跨时间的无缝连贯叙事，并且对物理规律有更深度的理解，Physics-IQ基准测试达到56.02%，大幅领先其他顶流模型。该模型由中国团队S and.ai（三呆科技）开发，创始人曹越是清华特奖得主，团队实力雄厚。Magi-1的发布标志着视频生成技术的新高度，用户可以在官网免费试玩，GitHub上已获得500+Star。

Magi-1的核心技术基于Diffusion Transformer，采用Flow-Matching作为训练目标，通过自回归去噪方式预测固定长度的视频片段，确保视频前后的因果性。模型在注意力机制上有多项创新，包括Block-Causal Attention、Parallel Attention Block、QK-Norm和GQA等，提升了训练稳定性和计算效率。此外，Magi-1还提出了可扩展分布式注意力机制MagiAttention，优化了计算负载均衡和通信效率，支持灵活的注意力掩码类型，并在推理基础设施上进行了针对性设计，满足实时流式视频生成和经济高效部署的需求。

在评估方面，Magi-1在人类评估、自动评估和物理理解能力评估中表现出色，尤其在指令跟随和运动质量方面有优势，VBench-I2V基准测试以总分89.28排名第一。模型的开源特性和卓越性能使其成为游戏规则改变者，为现实世界的创意领域开辟了新可能。Sand.AI团队已完成三轮融资，主要参与方包括今日资本、经纬创投等，团队规模和技术实力均不容小觑。Magi-1的发布不仅展示了中国在AI视频生成领域的领先地位，也为未来的技术创新和应用提供了广阔空间。