标签:扩散模型
扩散模型训练方法一直错了!谢赛宁:Representation matters
纽约大学的研究者谢赛宁及其团队提出了一种名为REPresentation Alignment(REPA)的表征对齐技术,旨在简化训练扩散Transformer的过程。该技术通过将预训练自...
统一transformer与diffusion!Meta融合新方法剑指下一代多模态王者
Transfusion是一种创新的多模态生成模型,由Meta和Waymo等机构的研究者开发,旨在通过单一模型同时处理离散和连续数据。该模型通过结合语言模型和扩散模型的...
1890美元,就能从头训练一个还不错的12亿参数扩散模型
Sony AI等机构的研究者开发了一种低成本的端到端pipeline,用于训练文本到图像的扩散模型,显著降低了训练成本,同时不需要访问数十亿张训练图像或专有数据集...
何恺明新作再战AI生成:入职MIT后首次带队,奥赛双料金牌得主邓明扬参与
何恺明在加入麻省理工学院(MIT)担任副教授后,首次独立带队完成了一项新的研究工作,提出了一种新的图像生成方法。该方法通过让自回归模型抛弃传统的矢量量...
基于扩散模型的,开源世界模型DIAMOND
研究人员联合开源了一款名为DIAMOND的世界模型,基于扩散模型,用于智能体训练、世界建模及多模态分布建模等强化学习应用。选择扩散模型为基础,因其能更好地...
世界模型也扩散!训练出的智能体竟然不错
在图像生成领域,扩散模型已成为主流方法,并开始被应用于挑战强化学习智能体。近期研究提出了扩散世界模型,其主要通过对离散潜在变量序列的操作来模拟环境...
加速扩散模型,最快1步生成SOTA级图片,字节Hyper-SD开源了
本文介绍了一种名为Hyper-SD的新型扩散模型蒸馏框架,由字节跳动技术团队提出,旨在解决现有扩散模型在图像生成和视频生成任务中的高计算成本问题。Hyper-SD...
Sora之后,OpenAI Lilian Weng亲自撰文教你从头设计视频生成扩散模型
视频生成的挑战视频生成比图像合成更复杂,因为它需要在不同帧之间保持时间一致性,并且收集高质量的视频数据比收集图像数据更具挑战性。从头建模视频生成文...
「个性化」图像生成时代来了!六大顶尖高校联手发布全新Gen4Gen框架
近年来,基于文本的图像生成技术取得了显著进展,特别是在生成个性化内容方面。个性化内容生成指的是用户提供一组最小概念图像集,然后对预训练的文本转图像...
无需训练,这个新方法实现了生成图像尺寸、分辨率自由
近日,香港中文大学与商汤科技联合实验室的研究者们提出了一种名为FouriScale的方法,旨在改善预训练扩散模型在生成高分辨率图像时的性能。扩散模型因其卓越...