“扩散模型”的搜索结果

CMU朱俊彦、Adobe新作:512×512图像推理,A100只用0.11秒
机器之心报道了一项由CMU和Adobe联合推出的研究,该研究通过简笔素描一键生成多风格画作,并可添加额外描述。CMU助理教授朱俊彦及其团队...
3D重建范式变革!最新模型MVDiffusion++:无需相机姿态,即可实现高清3D模型重建
。这项技术结合了计算方法的高保真度和人类视觉系统的灵活性,能够根据任意数量的无位姿图片生成密集、高分辨率的有位姿图像,实现高质...
全球首个类Sora开源复现方案来了!全面公开所有训练细节和模型权重
文章介绍了全球首个开源的类Sora架构视频生成模型Open-Sora 1.0的发布。该模型开放了整个训练流程,包括数据处理、训练细节和模型权重。...
可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」
。随着视觉生成领域的快速发展,在该领域取得了重大突破。然而,仅依赖文本来调节这些模型并不能满足多样化和复杂需求。因此,研究人员...
拖拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造
这篇文章介绍了一系列关于图像编辑的研究成果,其中包括了 DragGAN、DragDiffusion 和 StableDrag 三个项目。首先介绍了 DragGAN 项目,...
没等来OpenAI,等来了Open-Sora全面开源
机器之心编辑部近期报道了OpenAI Sora视频生成模型的开源进展。Sora因其出色的视频生成效果而受到全球关注。在成本降低46%的Sora训练推...
Sora竟是用这些数据训练的?OpenAI CTO坦白惹众怒
OpenAI的首席技术官Mira Murati在最近的一次采访中透露了更多关于其新推出的文生视频工具Sora的细节。采访主要围绕以下几个方面展开:Sor...
深入理解Sora技术原理|得物技术
视频生成时,获取随机噪声视频,通过训练的视频压缩网络,将噪声视频压缩成低维度的潜在空间数据,以便更好的处理视频数据。将压缩后的...
AI图片橡皮擦来了,清华&阿里合作推出「概念半透膜」模型,还能改头换面
清华大学丁贵广教授团队和阿里安全联合发布了概念半透膜模型(SPM模型),该模型可以在AI作图模型中精准、可控地擦除各类具象或抽象概念...
哲学家万字解析Sora本质,杨立昆点赞转发,AI视频离世界模拟器还有多远?
智东西报道了深度学习领域的一个重要讨论:视频生成器是否可以被视为世界模拟器。Meta首席科学家杨立昆分享了一篇探讨这一问题的万字博...
1 9 10 11 12 13 16