图像生成
图像,绘画
北大开源统一世界模型框架:多类合成推理任务一套搞定
在架构设计上,系统以Pipeline模块为核心调度中枢,统筹管理单轮推理与多轮交互流程。底层采用模型抽象规范,配合Operator模块完成多模态原始信号的校验与标...
预埋L3硬件、配「满血」版华为乾崑,启境GT7能让年轻人买单吗?
广汽集团与华为乾崑深度联合打造的新品牌启境正式亮相,首款车型启境GT7定位于30万级猎装车,旨在打破传统制造与供应链的边界,实现软硬件的原生融合。项目采...
DeepSeek首次有了视觉能力,技术论文却被它连夜删掉了
近期,深度求索在开启视觉能力灰度测试后,迅速发布并随后撤回了相关技术论述,其核心在于提出了视觉基元推理框架。传统大模型常依赖自然语言处理图像信息,...
实测纳逗 Pro:能做专业影视级内容的智能平台长啥样
当前人工智能视频技术已跨越早期功能验证阶段,全面进入追求画面质感、叙事逻辑与商业可用性深度融合的专业化发展新周期。行业竞争焦点逐步转向能否将生成式...
CVPR 2026 动态视觉智能观察梳理:Benchmark 之外的新考题已经出现
计算机视觉领域的研究重心正从单一基准测试的高精度优化,转向复杂开放环境下的持续理解与自适应。传统视觉系统长期依赖输入充分、目标预设及模型参数冻结的...
全网热议的GPT image 2平替?不止是信息图,它让连续的图文创作一步到位
商汤发布的SenseNova U1多模态模型通过底层架构重构,有效解决了传统AI生图工具在文字渲染、版式控制与视觉一致性上的核心痛点。该系列采用NEO-Unify基础架构...
美国暂停对华虹半导体部分供货?中方回应;东方甄选奖励300名员工市值4亿股份,人均超140万元;DeepSeek正在灰度测试「识图模式」
近期科技与产业领域动态密集,算力突破与芯片供应链博弈成为核心焦点。DeepSeek正式开启图像识别模式内测,标志着国内大语言模型向多模态理解能力迈出关键一...
开源SOTA!商汤原生多模态一个大脑完成看图、推理、作画
商汤正式开源新一代视觉多模态模型SenseNova U1,其核心突破在于全面摒弃传统的视觉编码器与变分自编码器拼接方案,转而采用自研的NEO-unify原生统一架构。该...
一个小众模型突然火了,可能代表新的范式。
近年大模型密集发布,虽在性能参数上持续优化,但底层架构的范式演进仍是技术发展的核心。行业已历经三大关键里程碑:通过内部思维链实现深度计算的推理范式...
CVPR 2026 生成式 AI 观察梳理:视觉模型开始重写默认设定
视觉人工智能领域的技术发展正经历从既定范式内性能堆叠向底层建模范式重构的关键转折。过去依赖的模型扩容与采样微调策略虽能短暂推升基准指标,但当前前沿...



