六年、六届学生接力,共铸上交大图像合成工具箱libcom
文章摘要
【关 键 词】 图像合成、深度学习、上海交通大学、牛力团队、libcom工具箱
上海交通大学牛力团队发布了一篇题为《Making Images Real Again: A Comprehensive Survey on Deep Image Composition》的综述报告,该报告深入探讨了图像合成领域的关键问题、子任务、数据集、传统与深度学习方法以及实验现象。团队自2018年起便致力于图像合成研究,至今已发表20余篇论文,开发了30多个原创模型,并推出了图像合成工具箱libcom,该工具箱集成了多种图像合成功能,如图像融合、颜色迁移、图像和谐化等,旨在提供全方位覆盖的图像合成解决方案。
libcom工具箱经过六年的开发和迭代,已实现无需训练微调即可直接使用的功能,截至2024年10月,已被下载安装1.2万次。工具箱的logo设计为半人马形象,象征着图像合成的目标——融合不同的图像元素。libcom的功能涵盖了从评估合成图质量到生成高质量合成图的全过程,包括剪切粘贴、alpha融合、泊松融合等传统图像融合方法,以及评估前景物体放置合理性的OPAScoreModel、生成合理阴影的ShadowGenerationModel等。
图像合成是图像编辑技术的一种,涉及在图像中添加元素。libcom的功能通过解决外观不一致性、几何不一致性、语义不一致性等问题,实现前景与背景的和谐融合。这些功能有的基于串行流程,有的基于并行流程,以解决前景和背景之间的不一致性。
尽管libcom功能丰富,但仍有改进空间,如数据集扩充、模型调优、添加新功能等。牛力团队诚邀对图像合成感兴趣的人才加入,共同推进libcom项目的发展。
原文和模型
【原文链接】 阅读原文 [ 2674字 | 11分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆