图像生成
图像,绘画
让 AI 搭3D乐高,为什么这么难?VAST 联合浙大等高校开源LegoACE
生成式人工智能在文本和图像等领域已取得显著进展,但在物理世界的结构化生成中仍面临复杂约束的挑战。以乐高搭建为例,模型不仅需要视觉合理,还必须满足砖...
多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL
过去的神经网络缩放定律通常仅关注模型参数量、数据量和训练计算量与损失函数下降之间的关系,但真实的训练过程受到训练步数、批大小、学习率等众多变量的复...
从一张午餐桌到无限宇宙,李飞飞押注AI的下一个维度
斯坦福教授李飞飞在近期多次深度访谈中明确提出,空间智能是人工智能发展的下一个核心前沿。当前主流的大语言模型本质上是一种存在信息损失的编码方式,若人...
告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成
流匹配模型的后训练对齐长期面临严重的“跷跷板效应”,单一奖励强化学习虽能在孤立任务中逼近性能极限,却直接导致非目标领域能力发生剧烈退化;而混合奖励组...
小鹏副总裁:小鹏可能是唯一欢迎特斯拉FSD入华的车企;有员工喊出「学三星罢工」!曝台积电Q1净利大增58%反降薪;DeepSeek一月内宕机三次
全球新能源车产业正经历技术验证深化与国内市场规模扩张。单纯依靠图像识别的自动化驾驶标准获得落地步署,为坚持同源视觉研发逻辑的企业提供了关键外部技术...
用了一个月,我终于明白华为为什么不做 Pura 90 Ultra
华为Pura 90 Pro与Pro Max机型取消了原有Ultra分级,转而采用差异化显著的双轨布局。外观层面,标准版保留哑光纹理以降低附着率,Pro Max首次在量产结构件上...
Meta华人发布ATLAS,一个词搞定可泛化的视觉推理!
Meta AI与香港中文大学联合提出全新视觉推理范式ATLAS,仅凭一个离散的功能词元即可首次实现智能体推理与潜在视觉推理的高效统一。该架构彻底摒弃了外部工具...
分享一个很实用的寓言故事prompt,5分钟帮你理解任何新概念。
传统概念教学往往依赖术语堆砌与直接灌输,导致学习者难以深刻理解且容易遗忘。将抽象知识转化为寓言故事,是突破认知壁垒、实现高效记忆的有效路径。该方法...
刚刚,谢赛宁团队放出第二代表征自编码器
传统变分自编码器在图像生成任务中逐渐显现出效率瓶颈,其潜在空间主要记录像素级物理特征而缺乏高层语义,导致扩散模型必须从零重复学习基础视觉常识。针对...
OpenAI和Google联手,要让每一张AI图片都无所遁形。
随着人工智能图像生成技术的快速迭代,造假成本大幅降低导致互联网信任成本急剧攀升,电商欺诈与虚假信息泛滥已成为严峻的社会问题。OpenAI宣布与Google达成...



