图像生成

图像,绘画

沿着何恺明团队「漂移模型」再走一步:奖励只需排名,单步文生图偏好优化提速3.51倍

针对单步生成模型在偏好后训练中难以获取去噪轨迹的问题,西湖大学与香港中文大学(深圳)的研究团队提出了一种名为DrPO的漂移偏好优化方法。该方法将漂移场...

AI成绩单背后,藏着一位华人“出题人”

随着前沿大语言模型能力的快速提升,传统的MMLU等基准评测逐渐面临“旧考卷失灵”的困境,前沿模型准确率逼近满分,难以有效区分模型间的真实能力差距。为解决...

奥德赛全网爆火,3天狂揽3万星!顶流网红搓出本地版ChatGPT

知名游戏网红PewDiePie在GitHub上开源了一款名为Odysseus的完全自托管本地AI工作空间,该项目上线短时间内便获得了极高的关注度与星标数。这款工具旨在打破科...

Midjourney新副业曝光:50万个传感器藏进浴池,60秒生成你的3D身体地图

Midjourney正式宣布进军医疗硬件领域,推出Midjourney Medical项目,并计划在旧金山开设一家专属Spa馆作为该项目的落地应用场景。该项目的核心产品是Midjourn...

CVPR前沿观察:AI下半场,阿里云破题Agent

在Agent时代,人工智能的核心挑战已从单纯的视觉感知转向对复杂世界的理解、生成及与真实业务的融合。决定智能体能否进入业务流程的关键,在于其处理复杂输入...

ICLR 2026|美图提出位置编码场 PE-Field ,让 DiT 感知和控制 3D 空间

随着视频和3D生成走向专业化内容生产端,AI创作对空间一致性和可控性的要求不断提升。然而,现有生成模型在处理连续视角或动态运动时,往往难以维持稳定的空...

端侧AI三强对决:苹果认输、谷歌死磕、中国堆参数,谁赢了?

全球手机行业的竞争焦点已从接入大模型转向将模型、芯片、系统和入口整合为默认能力。在端侧人工智能赛道上,苹果、谷歌与中国厂商展现出三种截然不同的底层...

Arm 神经技术与虚幻引擎 MegaLights 首登移动端,手游画质跨入电影时代

移动游戏图形技术长期面临画质与设备功耗、散热间的核心矛盾。为此,Arm与Sumo Digital联合推出《光影新生》技术演示项目。该项目首次将神经图形技术完整嵌入...

入围CVPR 2026最佳论文决选,ViT³用「测试时训练」突破Transformer复杂度瓶颈

阿里巴巴与清华大学合作的研究提出了ViT³模型,旨在解决视觉Transformer在处理高分辨率图像和复杂多模态输入时计算与显存成本急剧增加的问题。该研究将测试时...

CVPR 2026|告别「一属性一训练」,美图&北交大提出统一属性编辑框架 All-in-One Slider

生成式AI在影像内容生产中面临语义高度纠缠的问题,导致在调整人物属性时容易破坏整体结构或改变其他特征。为实现对生成图像的可解释、细粒度及连续属性操纵...
1 2 3 181