清华特奖得主团队视频生成AI一夜刷屏!100%开源+61页技术报告,还能无限扩展生成,网友:游戏规则改变者

AIGC动态6小时前发布 QbitAI
26 0 0
清华特奖得主团队视频生成AI一夜刷屏!100%开源+61页技术报告,还能无限扩展生成,网友:游戏规则改变者

 

文章摘要


【关 键 词】 AI视频生成开源模型创新

新国产AI视频生成模型Magi-1的发布引起了广泛关注,成为首个实现顶级画质输出的自回归视频生成模型,并且模型权重和代码完全开源。Magi-1的创新之处在于其无限长度扩展能力和对生成时长的精确控制,能够实现跨时间的无缝连贯叙事,并且对物理规律有更深度的理解,Physics-IQ基准测试达到56.02%,大幅领先其他顶流模型。该模型由中国团队S and.ai(三呆科技)开发,创始人曹越是清华特奖得主,团队实力雄厚。Magi-1的发布标志着视频生成技术的新高度,用户可以在官网免费试玩,GitHub上已获得500+Star。

Magi-1的核心技术基于Diffusion Transformer,采用Flow-Matching作为训练目标,通过自回归去噪方式预测固定长度的视频片段,确保视频前后的因果性。模型在注意力机制上有多项创新,包括Block-Causal Attention、Parallel Attention Block、QK-Norm和GQA等,提升了训练稳定性和计算效率。此外,Magi-1还提出了可扩展分布式注意力机制MagiAttention,优化了计算负载均衡和通信效率,支持灵活的注意力掩码类型,并在推理基础设施上进行了针对性设计,满足实时流式视频生成和经济高效部署的需求。

在评估方面,Magi-1在人类评估、自动评估和物理理解能力评估中表现出色,尤其在指令跟随和运动质量方面有优势,VBench-I2V基准测试以总分89.28排名第一。模型的开源特性和卓越性能使其成为游戏规则改变者,为现实世界的创意领域开辟了新可能。Sand.AI团队已完成三轮融资,主要参与方包括今日资本、经纬创投等,团队规模和技术实力均不容小觑。Magi-1的发布不仅展示了中国在AI视频生成领域的领先地位,也为未来的技术创新和应用提供了广阔空间。

原文和模型


【原文链接】 阅读原文 [ 2834字 | 12分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek-v3
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...