图像生成
图像,绘画
浙江大学研究员彭思达:底层空间感知技术对训练机器人有何作用?丨GAIR 2025
浙江大学研究员彭思达在GAIR 2025论坛上提出,人类行为数据可作为训练人形机器人的重要资源,通过采集人类日常活动记录,结合空间感知技术解决具身智能领域的...
图像分层生成:新加坡国立大学和Lowart AI实现了图像可编辑的PSD文件输出
OmniPSD通过Diffusion Transformer架构实现了分层图像生成与拆解,标志着AI从生成图片向生成可编辑资产的跨越。该系统由新加坡国立大学和Lowart AI联合开发,...
GPT-5.2降智遭全网差评!奥特曼慌了
OpenAI最新发布的GPT-5.2模型在多项基准测试中表现不及预期,未能超越谷歌的Gemini 3 Pro。Epoch AI报告显示,GPT-5.2的能力指数(ECI)得分为152,虽位列第...
GAIR 2025 世界模型分论坛:从通用感知到视频、物理世界模型的百家争鸣
在第八届GAIR全球人工智能与机器人大会的世界模型分论坛上,五位青年学者围绕具身智能和世界模型的前沿研究展开了深入探讨。浙江大学研究员彭思达提出,赋予...
半世纪难题48小时破解!陶哲轩组队把AI数学玩成打怪游戏了
陶哲轩与多位数学家合作,在AI工具的辅助下仅用48小时便解决了尘封50年的Erdős#1026问题。该问题最初由Paul Erdős于1975年提出,涉及实数序列中单调子序列的...
谢赛宁REPA得到大幅改进,只需不到4行代码
反直觉的发现颠覆了传统认知:驱动生成模型性能的关键因素并非预训练视觉编码器的全局语义信息(如ImageNet分类准确率),而是其提取的空间结构特征。一项由A...
GPT-5.2已上线24小时:差评如潮!
OpenAI最新发布的GPT-5.2模型在官方宣传中被称为'迄今为止在专业知识工作上最强大的模型系列',并在多项基准测试中刷新了SOTA水平。然而,用户反馈却呈现显著...
GPT-5.2获封“最强打工人”,谷歌同日以Gemini“性价比”系列应战
OpenAI在成立十周年之际发布了GPT-5.2大模型,CEO萨姆·奥尔特曼在纪念文章中表达了对公司研发方向的强烈信心。尽管面临DeepSeek、Grok、Claude等竞争对手的追...
推理快30%,性能超过千亿参数模型,15B模型Apriel-1.6重新定义端侧推理
ServiceNow人工智能团队最新发布的Apriel-1.6-15b-Thinker模型,以150亿参数的轻量级体量,在多模态推理能力上实现了显著突破。该模型不仅击败了体量大其十倍...
10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了
OpenAI与迪士尼达成一项重要合作,涉及版权授权、股权投资及AI内容生成。根据协议,OpenAI需向迪士尼出售价值10亿美元的股权,并授予迪士尼未来增持的权利。...




