标签:图像编辑
字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%
字节跳动最近开源了一种新的图像编辑方法,名为SuperEdit,该方法在性能上比当前最先进的图像编辑方法提高了9.19%,同时仅使用了1/30的训练数据和1/13的模型...
一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二
基于文本指令的图像编辑任务一直是图像生成和编辑领域的热点,近年来随着Gemini、GPT-4o等商业大模型的推出,这一领域的技术水平不断提升。然而,传统方法通...
真·打字P图!字节发布新模型SeedEdit,一句话爆改世界名画,可免费体验
字节跳动豆包大模型团队推出了国内首个产品化的通用图像编辑模型SeedEdit,该模型通过简单的自然语言指令即可实现图像编辑,无需复杂的描边涂抹。SeedEdit能...
把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了
中科院自动化所团队提出了一种名为FreeVS的全生成式新视角合成方法,该方法能够渲染真实场景中任意车辆行驶轨迹下的视频,无需进行耗时的场景重建过程。FreeV...
靠“一键抠图”拿下数千万美元ARR,估值5亿美元
华纳、网飞都在使用这家法国AI初创公司的技术Photoroom是一家法国AI初创公司,专注于图像编辑技术,提供API服务,面向电商、媒体和其他用户群。该公司的技术...
CVPR 2024 | 更高效、更准确的拖拽编辑 Drag Your Noise
何盛烽团队与华南师范大学合作,在CVPR 2024上发表了一项创新的研究成果《Drag Your Noise: Interactive Point-based Editing via Diffusion Semantic Propag...
可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」
。随着视觉生成领域的快速发展,在该领域取得了重大突破。然而,仅依赖文本来调节这些模型并不能满足多样化和复杂需求。因此,研究人员开始探索在T2I模型中引...
拖拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造
这篇文章介绍了一系列关于图像编辑的研究成果,其中包括了 DragGAN、DragDiffusion 和 StableDrag 三个项目。首先介绍了 DragGAN 项目,该项目通过拖拽鼠标实...
中科院等万字详解:最前沿图像扩散模型综述
中科院联合Adobe和苹果公司的研究人员发布了一篇关于图像编辑中扩散模型的重磅综述。这篇综述全文长达26页,包含1.5万余词,涵盖了297篇文献,全面研究了图像...
一文看尽297篇文献!中科院领衔发表首篇「基于扩散模型的图像编辑」综述
本文是关于基于扩散模型的图像编辑领域的首篇综述,全面研究了图像编辑的前沿方法,并将其精炼地划分为三个大类和14个子类。这篇综述长达26页,涵盖了297篇文...
1
2