「流匹配」成ICML 2025超热门主题!网友:都说了学物理的不准转计算机

文章摘要
【关 键 词】 生成式AI、流匹配、流体力学、扩散模型、机器学习
生成式AI领域的最新研究热点集中在探索更高质量、更稳定、更简洁且更通用的模型形态,其中流匹配(Flow Matching)技术成为了焦点。流匹配技术源自流体力学,通过将噪声映射到数据分布,逐步生成复杂的数据样本。其核心思想是学习将噪声转化为数据,通过插值路径将噪声点逐步转化为数据点。流匹配基于归一化流(Normalizing Flows, NF),通过一系列可逆的变量变换,将复杂的概率分布映射为简单分布,并能够从简单分布中生成逼真的数据样本。
流匹配技术的原理与流体力学中的连续性方程密切相关。连续性方程描述了质量守恒的原理,这一原理不仅适用于物理质量,也适用于概率质量。流匹配通过指定密度的变化过程,即从噪声分布逐步过渡到数据分布的插值轨迹,学习使这一演化成立的速度场。速度场使得从噪声中生成新的数据样本成为可能。流匹配的训练过程涉及学习平均插值速度场,通过推断空间中每一点可能朝向的终点分布,确定该点的速度场方向。
流匹配与扩散模型在生成模型领域具有密切关系。MIT副教授何恺明认为,扩散模型是流匹配的子集,当采用高斯分布作为插值策略时,扩散模型实际上是一种特殊的流匹配。这意味着这两个框架可以互换使用。流匹配提出了一种新的网络输出形式,将其视为速度场,这与传统扩散模型中的输出形式不同。此外,流匹配使用了一种简单的采样噪声调度策略,其更新规则与DDIM相同。
流匹配技术的引入为生成建模领域带来了新的模型设定,包括网络输出形式和采样噪声调度策略。这些设定可能在使用高阶采样器时带来性能差异,并影响训练过程中的动态行为。流匹配与扩散模型的结合为生成式AI提供了新的研究方向和工具,进一步推动了该领域的发展。
原文和模型
【原文链接】 阅读原文 [ 2256字 | 10分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★☆