图像生成
图像,绘画
何恺明团队论文全景扫描:一场关于「生成范式」的多角度突破 | CVPR 2026
生成式人工智能领域正经历从扩散模型向流匹配范式的深刻转型。基于常微分方程路径的流匹配因其理论高效性,正成为突破算力瓶颈的核心方向。研究团队通过系统...
原生Agent杀入画布!一站式搞定专业创作,全程可控、不抽卡
国内最大ComfyUI平台RunningHub正式推出原生AI智能体全能内容创作平台RHTV,旨在大幅降低专业影像与平面视觉的技术门槛。RHTV的核心架构将自然语言指令解析与...
比肩Z-Image!手机上实时图像生成、编辑模型!字节开源
字节技术团队近期开源的DreamLite模型是一款参数量仅0.39B的统一设备端扩散架构。该核心设计首次在单一轻量化模型中同时承载文本到图像生成与文本引导的图像...
AI PPT,这次是真不用返工了
该技术路径采用意图洞察、大纲构建、内容精炼与设计渲染的四步交互式流程,彻底改变了传统单模型一次性输出的不确定性。各独立智能体分别承担场景识别、联网...
国产双开源:让Mac成为你的私人AI工作站
随着终端芯片算力架构的持续升级,独立运行于本地的AI推理正逐步取代云端调用的单一模式。端侧AI依托设备专属硬件与定制框架,已成为下一代智能化工作站的核...
非常抽象:一群AI研究员给模型制造了让它们上瘾的毒品
针对大语言模型的情感与主观体验评估,研究人员通过五十六个基础模型系统性地构建了功能性幸福感测评框架。该框架摒弃了意识真伪的哲学争议,转而依赖经验效...
模型即审美:生图模型们正建起自己的“视觉方言”
当前AI图像生成模型在相同提示词下呈现出显著的视觉分歧,这种差异被界定为“模型味”。各模型的输出风格并非单纯的技术参数比拼,而是源于底层不同的商业假设...
北大开源统一世界模型框架:多类合成推理任务一套搞定
在架构设计上,系统以Pipeline模块为核心调度中枢,统筹管理单轮推理与多轮交互流程。底层采用模型抽象规范,配合Operator模块完成多模态原始信号的校验与标...
预埋L3硬件、配「满血」版华为乾崑,启境GT7能让年轻人买单吗?
广汽集团与华为乾崑深度联合打造的新品牌启境正式亮相,首款车型启境GT7定位于30万级猎装车,旨在打破传统制造与供应链的边界,实现软硬件的原生融合。项目采...
DeepSeek首次有了视觉能力,技术论文却被它连夜删掉了
近期,深度求索在开启视觉能力灰度测试后,迅速发布并随后撤回了相关技术论述,其核心在于提出了视觉基元推理框架。传统大模型常依赖自然语言处理图像信息,...




