图像生成
图像,绘画
无需训练,这个新方法实现了生成图像尺寸、分辨率自由
近日,香港中文大学与商汤科技联合实验室的研究者们提出了一种名为FouriScale的方法,旨在改善预训练扩散模型在生成高分辨率图像时的性能。扩散模型因其卓越...
低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法
悉尼大学的研究人员在最近的AAAI 2024学术会议上提出了一种名为EdgeNet的新型网络,旨在提高深度神经网络(DNNs)在视觉分类任务中的对抗鲁棒性。EdgeNet是一...
二次元专用超分AI模型APISR:在线可用,入选CVPR
机器之心最近报道了一项关于动漫超分辨率的研究,这项研究由密西根大学、耶鲁大学和浙江大学的联合团队完成,旨在通过人工智能技术提升老动漫的分辨率,以适...
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!
随着2026年数据荒的临近,硅谷的科技巨头们为了获取AI训练数据展开了激烈的竞争,不惜斥巨资购买互联网上的各类数据,包括旧照片、视频和聊天记录。这种对数...
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
GPT-4V的推出标志着多模态大模型研究的新篇章,它在多模态问答、推理和交互等领域展现了卓越的能力。然而,一些研究揭示了GPT-4V在基本能力上的不足,尤其是...
拒绝白人与亚洲人同框,Meta图像生成器的「歧视」,被人挖出来了
文章摘要 【关 键 词】 AI偏见、图像生成、种族刻板、性别歧视、技术论坛 在人工智能的世界里,AI偏见问题一直是一个备受关注的话题。近期,Meta...
Up主已经开始鬼畜,腾讯开源「AniPortrait」让照片唱歌说话
腾讯最近开源了一个名为AniPortrait的新项目,它能够基于音频和一张参考图像生成高质量的动画人像。这个项目迅速在GitHub上获得了超过2800个星标,显示出其受...
AI视频理解天花板,全新MiniGPT4-Video刷爆SOTA!宝格丽宣传片配文一绝
近日,KAUST和哈佛大学的研究团队提出了MiniGPT4-Video框架,这是一个专为视频理解设计的多模态大模型。它不仅能够理解复杂视频内容,还能创作诗歌和配文,显...
如何用AI画一部武侠漫画?画完后,我沉默了。
在这篇文章中,作者分享了他利用AI技术将自己20年前写的武侠小说制作成漫画的整个过程。这个项目的起源是作者想要在春节假期期间更深入地练习和研究AI技术。...
靠“一键抠图”拿下数千万美元ARR,估值5亿美元
华纳、网飞都在使用这家法国AI初创公司的技术Photoroom是一家法国AI初创公司,专注于图像编辑技术,提供API服务,面向电商、媒体和其他用户群。该公司的技术...