标签:扩散模型
世界模型也扩散!训练出的智能体竟然不错
在图像生成领域,扩散模型已成为主流方法,并开始被应用于挑战强化学习智能体。近期研究提出了扩散世界模型,其主要通过对离散潜在变量序列的操作来模拟环境...
加速扩散模型,最快1步生成SOTA级图片,字节Hyper-SD开源了
本文介绍了一种名为Hyper-SD的新型扩散模型蒸馏框架,由字节跳动技术团队提出,旨在解决现有扩散模型在图像生成和视频生成任务中的高计算成本问题。Hyper-SD...
Sora之后,OpenAI Lilian Weng亲自撰文教你从头设计视频生成扩散模型
视频生成的挑战视频生成比图像合成更复杂,因为它需要在不同帧之间保持时间一致性,并且收集高质量的视频数据比收集图像数据更具挑战性。从头建模视频生成文...
「个性化」图像生成时代来了!六大顶尖高校联手发布全新Gen4Gen框架
近年来,基于文本的图像生成技术取得了显著进展,特别是在生成个性化内容方面。个性化内容生成指的是用户提供一组最小概念图像集,然后对预训练的文本转图像...
无需训练,这个新方法实现了生成图像尺寸、分辨率自由
近日,香港中文大学与商汤科技联合实验室的研究者们提出了一种名为FouriScale的方法,旨在改善预训练扩散模型在生成高分辨率图像时的性能。扩散模型因其卓越...
CVPR 2024 | 更高效、更准确的拖拽编辑 Drag Your Noise
何盛烽团队与华南师范大学合作,在CVPR 2024上发表了一项创新的研究成果《Drag Your Noise: Interactive Point-based Editing via Diffusion Semantic Propag...
扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径
新智元最近报道了一项有趣的研究,一位博士研究人员利用「离散扩散」模型解决了图像表示迷宫中的最短路径问题。这项实验通过反复添加水平和垂直墙生成迷宫,...
CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题
扩散模型在图像生成方面的优秀表现引领了生成式模型的新纪元。然而,扩散模型在理论上存在一些问题,如采样时间端点处的奇点问题,以及由此导致的平均灰度等...
可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」
。随着视觉生成领域的快速发展,在该领域取得了重大突破。然而,仅依赖文本来调节这些模型并不能满足多样化和复杂需求。因此,研究人员开始探索在T2I模型中引...
清华系多模态大模型公司刚刚融了数亿元!放话“今年达到Sora效果”
生数科技是一家清华系多模态大模型公司,最近完成了一轮数亿元的融资,由多家投资方领投。他们的研究成果包括文生图、文生3D模型、文生视频等领域。公司提出...