标签:扩散模型
Sora之后,OpenAI Lilian Weng亲自撰文教你从头设计视频生成扩散模型
视频生成的挑战视频生成比图像合成更复杂,因为它需要在不同帧之间保持时间一致性,并且收集高质量的视频数据比收集图像数据更具挑战性。从头建模视频生成文...
「个性化」图像生成时代来了!六大顶尖高校联手发布全新Gen4Gen框架
近年来,基于文本的图像生成技术取得了显著进展,特别是在生成个性化内容方面。个性化内容生成指的是用户提供一组最小概念图像集,然后对预训练的文本转图像...
无需训练,这个新方法实现了生成图像尺寸、分辨率自由
近日,香港中文大学与商汤科技联合实验室的研究者们提出了一种名为FouriScale的方法,旨在改善预训练扩散模型在生成高分辨率图像时的性能。扩散模型因其卓越...
CVPR 2024 | 更高效、更准确的拖拽编辑 Drag Your Noise
何盛烽团队与华南师范大学合作,在CVPR 2024上发表了一项创新的研究成果《Drag Your Noise: Interactive Point-based Editing via Diffusion Semantic Propag...
扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径
新智元最近报道了一项有趣的研究,一位博士研究人员利用「离散扩散」模型解决了图像表示迷宫中的最短路径问题。这项实验通过反复添加水平和垂直墙生成迷宫,...
CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题
扩散模型在图像生成方面的优秀表现引领了生成式模型的新纪元。然而,扩散模型在理论上存在一些问题,如采样时间端点处的奇点问题,以及由此导致的平均灰度等...
可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」
。随着视觉生成领域的快速发展,在该领域取得了重大突破。然而,仅依赖文本来调节这些模型并不能满足多样化和复杂需求。因此,研究人员开始探索在T2I模型中引...
清华系多模态大模型公司刚刚融了数亿元!放话“今年达到Sora效果”
生数科技是一家清华系多模态大模型公司,最近完成了一轮数亿元的融资,由多家投资方领投。他们的研究成果包括文生图、文生3D模型、文生视频等领域。公司提出...
被误解的「中文版Sora」背后,字节跳动有哪些技术?
OpenAI 在 2024 年初发布了一款名为 Sora 的生成式 AI 产品,引发了视频生成领域的广泛关注。Sora 的发布提高了视频生成技术的标准,引发了科技公司之间的竞...
中科院等万字详解:最前沿图像扩散模型综述
中科院联合Adobe和苹果公司的研究人员发布了一篇关于图像编辑中扩散模型的重磅综述。这篇综述全文长达26页,包含1.5万余词,涵盖了297篇文献,全面研究了图像...