标签:图像编辑
AI生图大洗牌!流匹配架构颠覆传统,一个模型同时接受文本和图像输入
AI生图领域有新突破,新模型FLUX.1 Kontext可同时接受文本和图像输入,它采用流匹配架构,与此前技术不同,由Black Forest Labs推出,官方称能真正实现上下文...
一键开关灯!谷歌用扩散模型,将电影级光影控制玩到极致
Google最近推出的LightLab项目,旨在通过单张图像实现对光源的细粒度参数化控制。这一技术允许用户调整可见光源的强度和颜色、环境光的强度,并能够将虚拟光...
字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%
字节跳动最近开源了一种新的图像编辑方法,名为SuperEdit,该方法在性能上比当前最先进的图像编辑方法提高了9.19%,同时仅使用了1/30的训练数据和1/13的模型...
一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二
基于文本指令的图像编辑任务一直是图像生成和编辑领域的热点,近年来随着Gemini、GPT-4o等商业大模型的推出,这一领域的技术水平不断提升。然而,传统方法通...
真·打字P图!字节发布新模型SeedEdit,一句话爆改世界名画,可免费体验
字节跳动豆包大模型团队推出了国内首个产品化的通用图像编辑模型SeedEdit,该模型通过简单的自然语言指令即可实现图像编辑,无需复杂的描边涂抹。SeedEdit能...
把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了
中科院自动化所团队提出了一种名为FreeVS的全生成式新视角合成方法,该方法能够渲染真实场景中任意车辆行驶轨迹下的视频,无需进行耗时的场景重建过程。FreeV...
靠“一键抠图”拿下数千万美元ARR,估值5亿美元
华纳、网飞都在使用这家法国AI初创公司的技术Photoroom是一家法国AI初创公司,专注于图像编辑技术,提供API服务,面向电商、媒体和其他用户群。该公司的技术...
CVPR 2024 | 更高效、更准确的拖拽编辑 Drag Your Noise
何盛烽团队与华南师范大学合作,在CVPR 2024上发表了一项创新的研究成果《Drag Your Noise: Interactive Point-based Editing via Diffusion Semantic Propag...
可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」
。随着视觉生成领域的快速发展,在该领域取得了重大突破。然而,仅依赖文本来调节这些模型并不能满足多样化和复杂需求。因此,研究人员开始探索在T2I模型中引...
拖拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造
这篇文章介绍了一系列关于图像编辑的研究成果,其中包括了 DragGAN、DragDiffusion 和 StableDrag 三个项目。首先介绍了 DragGAN 项目,该项目通过拖拽鼠标实...
1
2