图像生成
图像,绘画
炒菜、做实验、弹钢琴!Genesis最强“AI灵巧手”demo,寻找新的Scaling Law
Genesis AI发布的首个机器人基础模型GENE-26.5实现了以真实物理速度完成烹饪、移液、线束组装及乐器演奏等高复杂度任务的能力突破。测试过程中,模型能够自主...
港科广陈昶昊团队:只用一张 RGB 图像,让机器读懂室内 3D 空间丨CVPR 2026
定量评估结果显示,在零三维语义标签注入条件下,该算法斩获59.50的几何交并比与21.05的语义均分,基础占据预测精度已超越传统闭集基线,且单卡推理帧率实现...
港广科陈昶昊团队:只用一张 RGB 图像,让机器读懂室内 3D 空间丨CVPR 2026
面向未来家庭与服务机器人的空间交互需求,室内三维视觉感知面临场景高度动态、遮挡密集及预定义类别受限等挑战,传统方案通常依赖昂贵的逐体素语义标注。为...
CVPR 2026 3D 视觉前沿梳理:模型正在学会理解、生成和构建世界
当前三维视觉研究正从单纯的图像重建生成,迈向深度的空间理解与物理动态模拟。视觉人工智能的核心目标已从二维表面感知转向对真实三维世界的建模与交互。研...
外星人真存在?美国公布首批UFO文件,画面曝光;梁文锋自掏200亿领投DeepSeek,V4.1拟6月上新;阶跃星辰将完成近25亿美元融资,冲刺IPO
全球人工智能产业正步入资本加速与底层技术攻坚并行的关键阶段。头部初创企业拟发起数百亿美元规模融资,计划通过巨额算力投入突破研发瓶颈并冲击行业估值新...
OpenAI官方CLI上线,跟复杂的SDK说拜拜
OpenAI Codex 团队正式发布开源命令行交互工具 openai-cli,核心逻辑是优化开发者使用云端 AI 模型体验。过去调用模型能力往往依赖可视化界面或编写大量脚,...
何恺明团队论文全景扫描:一场关于「生成范式」的多角度突破 | CVPR 2026
生成式人工智能领域正经历从扩散模型向流匹配范式的深刻转型。基于常微分方程路径的流匹配因其理论高效性,正成为突破算力瓶颈的核心方向。研究团队通过系统...
原生Agent杀入画布!一站式搞定专业创作,全程可控、不抽卡
国内最大ComfyUI平台RunningHub正式推出原生AI智能体全能内容创作平台RHTV,旨在大幅降低专业影像与平面视觉的技术门槛。RHTV的核心架构将自然语言指令解析与...
比肩Z-Image!手机上实时图像生成、编辑模型!字节开源
字节技术团队近期开源的DreamLite模型是一款参数量仅0.39B的统一设备端扩散架构。该核心设计首次在单一轻量化模型中同时承载文本到图像生成与文本引导的图像...
AI PPT,这次是真不用返工了
该技术路径采用意图洞察、大纲构建、内容精炼与设计渲染的四步交互式流程,彻底改变了传统单模型一次性输出的不确定性。各独立智能体分别承担场景识别、联网...



