GAN已死?GAN万岁!布朗康奈尔新作爆火,一夜碾压扩散模型

AIGC动态1天前发布 AIera
77 0 0
GAN已死?GAN万岁!布朗康奈尔新作爆火,一夜碾压扩散模型

 

文章摘要


【关 键 词】 R3GAN正则化局部收敛性能提升现代化架构

布朗大学和康奈尔大学的研究者提出了一种新型GAN架构——R3GAN(Re-GAN),这一突破性架构引入了正则化相对性损失函数,不仅在理论上证明了局部收敛性,而且在实践中显著提升了模型训练的稳定性。R3GAN摒弃了传统GAN依赖的各种技巧,转而采用现代化的深度学习架构,以一半的模型参数和单步生成方式达到与EDM(扩散模型)相当的性能。

R3GAN的核心在于新型目标函数,将相对配对GAN损失(RpGAN)与零中心梯度惩罚相结合,提高了稳定性。研究者在数据上证明了带梯度惩罚的RpGAN享有与正则化经典GAN相同的局部收敛性。此外,R3GAN摒弃了StyleGAN中的反锁技巧,转而采用简洁而高效的现代架构设计,通过适当的ResNet设计、初始化和重采样,加上分组卷积和无归一化,达到了甚至超越StyleGAN的性能。

实验中,R3GAN在FFHQ、ImageNet、CIFAR和Stacked MNIST数据集上的FID表现优于StyleGAN、其他最先进的GAN和扩散模型。研究者通过逐步现代化改造,从StyleGAN2基准模型出发,移除了所有非必要特性,应用了所提出的损失函数,并逐步对网络骨干进行现代化改造。在FFHQ 256×256数据集上评估每种配置,所有配置的网络容量大致保持相同,生成器和判别器的可训练参数均约为2500万。

R3GAN在不同数据集上的FID表现均优于现有GAN方法和扩散模型,且在样本多样性方面达到了与扩散模型相似或略差的召回率,但优于现有的GAN模型。这一研究证明了通过改进的正则化损失,让GAN的训练不必那么棘手,并且在实验中开发了一个简单的GAN基准,在不使用任何技巧的情况下,实现了优异的性能。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 5323字 | 22分钟 ]
【原文作者】 新智元
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...