图像生成

图像,绘画

Meta华人发布ATLAS,一个词搞定可泛化的视觉推理!

Meta AI与香港中文大学联合提出全新视觉推理范式ATLAS,仅凭一个离散的功能词元即可首次实现智能体推理与潜在视觉推理的高效统一。该架构彻底摒弃了外部工具...

分享一个很实用的寓言故事prompt,5分钟帮你理解任何新概念。

传统概念教学往往依赖术语堆砌与直接灌输,导致学习者难以深刻理解且容易遗忘。将抽象知识转化为寓言故事,是突破认知壁垒、实现高效记忆的有效路径。该方法...

刚刚,谢赛宁团队放出第二代表征自编码器

传统变分自编码器在图像生成任务中逐渐显现出效率瓶颈,其潜在空间主要记录像素级物理特征而缺乏高层语义,导致扩散模型必须从零重复学习基础视觉常识。针对...

OpenAI和Google联手,要让每一张AI图片都无所遁形。

随着人工智能图像生成技术的快速迭代,造假成本大幅降低导致互联网信任成本急剧攀升,电商欺诈与虚假信息泛滥已成为严峻的社会问题。OpenAI宣布与Google达成...

谷歌I/O 2026震撼发布:全面进入智能体Gemini时代

谷歌在I/O开发者大会上宣布全面迈入智能体Gemini时代,推动人工智能从功能堆砌转向覆盖信息、创作与交易的行动系统。底层算力与基础模型的提速降本,为上层应...

I/O大会开完,谷歌连搜索框都变智能体了

谷歌I/O大会正式确立了向全天候智能体时代转型的核心战略,大模型行业竞争焦点已从基准测试榜单全面转向工程落地与规模化应用。当前全球用户通过谷歌渠道每月...

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

谷歌近期产品发布会全面展示了以人工智能为核心的技术演进与生态布局。此次发布的核心主线围绕模型能力迭代、智能体系统构建以及跨平台生态整合展开。在模型...

复旦可信具身智能研究院&上海交大:给自动驾驶装上可检索的「空间记忆」丨CVPR 2026

自动驾驶系统在夜间、雨雾或复杂路口等低能见度场景中,常因实时传感器受限而难以准确理解道路空间。针对这一瓶颈,研究团队提出引入离线地理信息作为可检索...

抢先李飞飞!世界模型能多人联机玩FPS游戏了

Odyssey团队推出基于通用世界模型Agora-1的多人第一人称射击体验,该应用完全摒弃传统游戏引擎、物理规则与预设渲染代码,所有画面与场景均由算法实时演算生...

无需构造偏好对:TGO用标量反馈对齐视觉生成模型|ICML’26

生成模型的偏好对齐正在从传统的成对比较转向利用标量反馈的新阶段。过往主流算法依赖成对偏好数据进行训练,虽结构优雅且计算高效,但将真实场景中连续的多...
1 2 3 178