图像生成
图像,绘画
GPT-5.6大量实测流出:本周四或登场
OpenAI即将推出代号为kindle-alpha的GPT-5.6 Pro模型以及GPT-Bidi-1语音项目,展现出在视觉理解与双向语音交互领域的重大技术突破。GPT-5.6 Pro在图像生成与...
一文总结2026火山引擎FORCE大会 – 向Coding和Agent全面进军。
伴随基础模型的升级,豆包专业版推出了全新的办公模式。底座模型智能体能力的提升,使得该办公模式能够出色执行复杂的通用办公任务,实现了从底层模型到上层...
为物理AI打造视觉芯片,与光科技完成亿元融资
与光科技近日完成亿元级A轮及A+轮融资,资金将主要用于计算光谱芯片的量产与技术升级,并推进物理AI视觉芯片的研发,旨在打造空间智能与世界模型的感知硬件入...
刚刚,百度开源拿下全球第一!作者疑似DeepSeek出走大神
百度近期开源了名为Unlimited OCR的光学字符识别模型,该模型总参数为3B,实际激活参数仅为500M。尽管参数规模极小,该模型在OmniDocBench v1.5和v1.6评测中...
何恺明团队新作:删掉VAE和私有数据后,文生图竟然更强了
何恺明团队近期发布了一款极简像素空间文本生成图像模型,旨在打破当前主流方案依赖复杂组件的惯例。该模型摒弃了视觉自编码器、自适应层归一化条件注入、辅...
同样算力质量更高,西湖大学把扩散缓存做成了“离线搜索题”
近年来,以FLUX和Wan为代表的扩散生成模型在图像和视频生成领域表现出色,但多步去噪过程导致推理算力成本高昂,严重拖慢响应速度。现有的步级缓存技术虽能复...
诺奖得主转投Anthropic,谷歌48小时连失两大牛,内部信仰崩塌?
谷歌在短短四十八小时内相继失去了两位人工智能领域的核心人物。Transformer奠基人之一、Gemini团队联席主管Noam Shazeer宣布离职并加入OpenAI担任架构研究负...
沿着何恺明团队「漂移模型」再走一步:奖励只需排名,单步文生图偏好优化提速3.51倍
针对单步生成模型在偏好后训练中难以获取去噪轨迹的问题,西湖大学与香港中文大学(深圳)的研究团队提出了一种名为DrPO的漂移偏好优化方法。该方法将漂移场...
AI成绩单背后,藏着一位华人“出题人”
随着前沿大语言模型能力的快速提升,传统的MMLU等基准评测逐渐面临“旧考卷失灵”的困境,前沿模型准确率逼近满分,难以有效区分模型间的真实能力差距。为解决...
奥德赛全网爆火,3天狂揽3万星!顶流网红搓出本地版ChatGPT
知名游戏网红PewDiePie在GitHub上开源了一款名为Odysseus的完全自托管本地AI工作空间,该项目上线短时间内便获得了极高的关注度与星标数。这款工具旨在打破科...


