图像生成

图像,绘画

GPT-5.6大量实测流出:本周四或登场

OpenAI即将推出代号为kindle-alpha的GPT-5.6 Pro模型以及GPT-Bidi-1语音项目,展现出在视觉理解与双向语音交互领域的重大技术突破。GPT-5.6 Pro在图像生成与...

一文总结2026火山引擎FORCE大会 – 向Coding和Agent全面进军。

伴随基础模型的升级,豆包专业版推出了全新的办公模式。底座模型智能体能力的提升,使得该办公模式能够出色执行复杂的通用办公任务,实现了从底层模型到上层...

为物理AI打造视觉芯片,与光科技完成亿元融资

与光科技近日完成亿元级A轮及A+轮融资,资金将主要用于计算光谱芯片的量产与技术升级,并推进物理AI视觉芯片的研发,旨在打造空间智能与世界模型的感知硬件入...

刚刚,百度开源拿下全球第一!作者疑似DeepSeek出走大神

百度近期开源了名为Unlimited OCR的光学字符识别模型,该模型总参数为3B,实际激活参数仅为500M。尽管参数规模极小,该模型在OmniDocBench v1.5和v1.6评测中...

何恺明团队新作:删掉VAE和私有数据后,文生图竟然更强了

何恺明团队近期发布了一款极简像素空间文本生成图像模型,旨在打破当前主流方案依赖复杂组件的惯例。该模型摒弃了视觉自编码器、自适应层归一化条件注入、辅...

同样算力质量更高,西湖大学把扩散缓存做成了“离线搜索题”

近年来,以FLUX和Wan为代表的扩散生成模型在图像和视频生成领域表现出色,但多步去噪过程导致推理算力成本高昂,严重拖慢响应速度。现有的步级缓存技术虽能复...

诺奖得主转投Anthropic,谷歌48小时连失两大牛,内部信仰崩塌?

谷歌在短短四十八小时内相继失去了两位人工智能领域的核心人物。Transformer奠基人之一、Gemini团队联席主管Noam Shazeer宣布离职并加入OpenAI担任架构研究负...

沿着何恺明团队「漂移模型」再走一步:奖励只需排名,单步文生图偏好优化提速3.51倍

针对单步生成模型在偏好后训练中难以获取去噪轨迹的问题,西湖大学与香港中文大学(深圳)的研究团队提出了一种名为DrPO的漂移偏好优化方法。该方法将漂移场...

AI成绩单背后,藏着一位华人“出题人”

随着前沿大语言模型能力的快速提升,传统的MMLU等基准评测逐渐面临“旧考卷失灵”的困境,前沿模型准确率逼近满分,难以有效区分模型间的真实能力差距。为解决...

奥德赛全网爆火,3天狂揽3万星!顶流网红搓出本地版ChatGPT

知名游戏网红PewDiePie在GitHub上开源了一款名为Odysseus的完全自托管本地AI工作空间,该项目上线短时间内便获得了极高的关注度与星标数。这款工具旨在打破科...
1 2 3 182