GAN已死？GAN万岁！布朗康奈尔新作爆火，一夜碾压扩散模型

1,702 0 0

文章摘要

布朗大学和康奈尔大学的研究者提出了一种新型GAN架构——R3GAN（Re-GAN），这一突破性架构引入了正则化相对性损失函数，不仅在理论上证明了局部收敛性，而且在实践中显著提升了模型训练的稳定性。R3GAN摒弃了传统GAN依赖的各种技巧，转而采用现代化的深度学习架构，以一半的模型参数和单步生成方式达到与EDM（扩散模型）相当的性能。

R3GAN的核心在于新型目标函数，将相对配对GAN损失（RpGAN）与零中心梯度惩罚相结合，提高了稳定性。研究者在数据上证明了带梯度惩罚的RpGAN享有与正则化经典GAN相同的局部收敛性。此外，R3GAN摒弃了StyleGAN中的反锁技巧，转而采用简洁而高效的现代架构设计，通过适当的ResNet设计、初始化和重采样，加上分组卷积和无归一化，达到了甚至超越StyleGAN的性能。

实验中，R3GAN在FFHQ、ImageNet、CIFAR和Stacked MNIST数据集上的FID表现优于StyleGAN、其他最先进的GAN和扩散模型。研究者通过逐步现代化改造，从StyleGAN2基准模型出发，移除了所有非必要特性，应用了所提出的损失函数，并逐步对网络骨干进行现代化改造。在FFHQ 256×256数据集上评估每种配置，所有配置的网络容量大致保持相同，生成器和判别器的可训练参数均约为2500万。

R3GAN在不同数据集上的FID表现均优于现有GAN方法和扩散模型，且在样本多样性方面达到了与扩散模型相似或略差的召回率，但优于现有的GAN模型。这一研究证明了通过改进的正则化损失，让GAN的训练不必那么棘手，并且在实验中开发了一个简单的GAN基准，在不使用任何技巧的情况下，实现了优异的性能。