图像生成

图像,绘画

10B超越Gemini-2.5-Pro!阶跃星辰端侧多模态天花板开源

阶跃星辰多模态智能团队最新开源的STEP3-VL-10B模型以100亿参数规模实现了超越千亿参数模型的性能突破。该模型在数学推理、视觉感知及复杂指令遵循等任务中,...

黑森林FLUX.2 Klein开源,亚秒级高质量图像生成和编辑,普通电脑就能跑

FLUX.2 Klein系列模型通过亚秒级响应和统一架构设计,重新定义了图像生成与编辑的技术边界。黑森林实验室最新发布的这一模型家族,将高质量视觉创作压缩至0.5...

从「偶然发现」走向「必然创造」:AI如何重塑生物制造全链路?

在第四届合成生物学及生物制造大会上,瑞德林生物技术公司研发总裁李加忠系统阐述了人工智能如何深度重塑生物制造全链条。AI for Science(AI4S)正推动合成...

用2D先验自动生成3D标注,自动驾驶、具身智能有福了丨IDEA团队开源

3D实例分割技术长期以来面临训练数据稀缺和标注成本高昂的挑战,这限制了其在自动驾驶、智能家居等领域的应用。传统方法依赖人工标注3D掩码,不仅耗时且难以...

顶级视频模型半衰期只有 30 天,但生成式媒体 infra 公司的收入却在一年增长了 60 倍

在生成式媒体领域,算力需求呈现出指数级增长的特点。处理一个大型语言模型(LLM)的单个Prompt(约200 Token)所需的算力若定义为1个单位,生成一张高质量图...

谷歌Veo 3.1更新:更一致性、更具创造力和控制力

谷歌最新发布的Veo 3.1版本在AIGC视频生成领域实现了多项突破性进展。此次更新的核心在于解决了AI生成视频中角色、背景与物体动态一致性的行业痛点,通过创新...

OpenAI投的机器人公司,发世界模型,靠“想象”干活儿

1X公司近日发布了名为1X World Model(1XWM)的世界模型,旨在提升其人形机器人Neo的通识行为能力和物理世界理解力。这一模型通过文字指令和初始画面生成未来...

上科大何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」

多模态模型在感知、理解与生成等方面的能力持续提升,但其输出中仍普遍存在与客观事实不一致的内容,即多模态幻觉现象。当模型面对信息缺失、语义含混或视觉...

王小川手里还握着冰冷的30亿

2026年1月13日,百川智能召开媒体沟通会,创始人王小川首次公开回应公司战略转型与医疗大模型的技术进展。他认为行业已到“爆发”节点,百川需要“重新建立连接”...

边看边创造,在 PixVerse R1 的实时世界模型里,你真是上帝

爱诗科技发布的PixVerse R1被定位为'全球首个通用实时世界模型',其核心突破在于彻底改变了视频生成的交互范式。传统视频生成是单向的指令-等待-输出流程,而...
1 2 3 162