标签:扩散模型

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径

新智元最近报道了一项有趣的研究,一位博士研究人员利用「离散扩散」模型解决了图像表示迷宫中的最短路径问题。这项实验通过反复添加水平和垂直墙生成迷宫,...

CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

扩散模型在图像生成方面的优秀表现引领了生成式模型的新纪元。然而,扩散模型在理论上存在一些问题,如采样时间端点处的奇点问题,以及由此导致的平均灰度等...

可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」

。随着视觉生成领域的快速发展,在该领域取得了重大突破。然而,仅依赖文本来调节这些模型并不能满足多样化和复杂需求。因此,研究人员开始探索在T2I模型中引...

清华系多模态大模型公司刚刚融了数亿元!放话“今年达到Sora效果”

生数科技是一家清华系多模态大模型公司,最近完成了一轮数亿元的融资,由多家投资方领投。他们的研究成果包括文生图、文生3D模型、文生视频等领域。公司提出...

被误解的「中文版Sora」背后,字节跳动有哪些技术?

OpenAI 在 2024 年初发布了一款名为 Sora 的生成式 AI 产品,引发了视频生成领域的广泛关注。Sora 的发布提高了视频生成技术的标准,引发了科技公司之间的竞...

中科院等万字详解:最前沿图像扩散模型综述

中科院联合Adobe和苹果公司的研究人员发布了一篇关于图像编辑中扩散模型的重磅综述。这篇综述全文长达26页,包含1.5万余词,涵盖了297篇文献,全面研究了图像...

一文看尽297篇文献!中科院领衔发表首篇「基于扩散模型的图像编辑」综述

本文是关于基于扩散模型的图像编辑领域的首篇综述,全面研究了图像编辑的前沿方法,并将其精炼地划分为三个大类和14个子类。这篇综述长达26页,涵盖了297篇文...

微软37页论文逆向工程Sora,得到了哪些结论?

摘要:本文回顾了Sora视频技术的发展背景、技术细节、应用前景以及局限性。Sora是OpenAI开发的一种能够根据文本指令生成长达一分钟视频的模型,它在视觉质量...

想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速

摘要总结:Sora的创新:2024年,Sora的出现为文生视频研究者设立了新目标。其核心技术之一是将视觉数据转化为统一表征形式,结合Transformer和扩散模型,展现...

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

本文探讨了在扩散模型中UNet结构的long skip connection上应用scaling操作对模型训练稳定性的影响。研究发现,适当的scaling系数可以缓解特征不稳定现象,提...
1 2 3