图像生成

图像,绘画

世界杯“名场面”,居然是AI造假?

随着人工智能技术的快速普及,其在大型体育赛事中的应用日益广泛,但同时也催生了大量虚假内容。在近期的世界杯期间,各类由人工智能生成的虚假影像在社交平...

CVPR 2026最热方向,被一家杭州团队率先跑进了端侧!

杭州Om AI团队发布了全球首个面向物理世界的端侧流式多模态模型系列VLX,该系列专为真实世界的端侧与具身场景打造。VLX系列包含三款模型,分别负责实时流式感...

跨机器、物体与各种任务!RoboScience发布通用具身大模型

RoboScience机器科学发布了Visics通用具身大模型,全面披露了VLOA技术架构。该模型以3D点云轨迹作为全新的具身基础表征单元,旨在解决具身智能领域泛化能力差...

华为天才少年一作,港大MaRS Lab拿下IEEE TRO傅京孙纪念最佳论文奖

近日,香港大学张富副教授团队研发的FAST-LIVO2系统荣获IEEE机器人与自动化领域顶级期刊TRO颁发的傅京孙纪念最佳论文奖,该奖项系历史上第二次颁给中国科研团...

GPT-5.6大量实测流出:本周四或登场

OpenAI即将推出代号为kindle-alpha的GPT-5.6 Pro模型以及GPT-Bidi-1语音项目,展现出在视觉理解与双向语音交互领域的重大技术突破。GPT-5.6 Pro在图像生成与...

一文总结2026火山引擎FORCE大会 – 向Coding和Agent全面进军。

伴随基础模型的升级,豆包专业版推出了全新的办公模式。底座模型智能体能力的提升,使得该办公模式能够出色执行复杂的通用办公任务,实现了从底层模型到上层...

为物理AI打造视觉芯片,与光科技完成亿元融资

与光科技近日完成亿元级A轮及A+轮融资,资金将主要用于计算光谱芯片的量产与技术升级,并推进物理AI视觉芯片的研发,旨在打造空间智能与世界模型的感知硬件入...

刚刚,百度开源拿下全球第一!作者疑似DeepSeek出走大神

百度近期开源了名为Unlimited OCR的光学字符识别模型,该模型总参数为3B,实际激活参数仅为500M。尽管参数规模极小,该模型在OmniDocBench v1.5和v1.6评测中...

何恺明团队新作:删掉VAE和私有数据后,文生图竟然更强了

何恺明团队近期发布了一款极简像素空间文本生成图像模型,旨在打破当前主流方案依赖复杂组件的惯例。该模型摒弃了视觉自编码器、自适应层归一化条件注入、辅...

同样算力质量更高,西湖大学把扩散缓存做成了“离线搜索题”

近年来,以FLUX和Wan为代表的扩散生成模型在图像和视频生成领域表现出色,但多步去噪过程导致推理算力成本高昂,严重拖慢响应速度。现有的步级缓存技术虽能复...
1 2 3 183