图像生成

图像,绘画

对话速腾聚创杨先声:机器人的通用智能,先从一双「不骗人」的眼睛开始 | ICRA 2026

当前全球具身智能行业在落地过程中面临着机器人视觉感知能力不足的痛点,传统传感器难以精准感知三维世界,导致机器人操作速度慢且无法进行精细操作。为解决...

字节开源王炸Bernini!轻松拿捏各类视频编辑任务

Bernini团队发布并开源了一款将多模态大模型与扩散模型深度融合的统一视频生成与编辑框架。该框架通过物理分工理念,让多模态大模型担任语义规划师,基于DiT...

李飞飞万字长文刷屏:网红文生视频只是“画皮”,真正的万亿级风口在这|附中英全文

李飞飞及其团队针对当前人工智能领域被过度使用的“世界模型”概念进行了深度剖析,指出物理世界的运行基底与语言模型截然不同。真正的世界模型必须学习空间和...

英伟达全模态Cosmos 3:一个模型搞定物理智能看、想、做、演

英伟达最新发布了面向物理智能的全模态世界模型Cosmos 3,该模型采用统一的混合Transformer架构,能够同时处理和生成语言、图像、视频、音频与动作序列五种模...

CCIG 2026 在广州圆满落幕:4200 余位专家学者共绘图像图形发展新图景

2026年中国图像图形大会于5月29日至31日在广州成功举办,汇聚了学术界与产业界的四千余位专家学者及企业代表。此次大会围绕图像图形前沿方向、产业创新路径以...

拒绝蒸馏!微软发布自研MAI-Thinking-1追平Claude Opus 4.6:完全从零训练,不沾任何第三方模型输出

微软在Build大会上发布了一系列自研AI模型,标志着其从AI应用整合者向全栈AI基础设施与模型提供者的战略转型。公司高管强调致力于打造支持人类的“人本主义超...

微软Build 2026:当Windows成为智能体的“一等公民”

微软在Build 2026开发者大会上宣布将智能体战略从概念验证推向规模化生产,确立“Agent优先”战略,意图将Windows重新定义为AI智能体的原生运行环境,实现从AI...

何泰然在线摇人!底薪数百万元、Sora之父带队、OpenAI全栈造「人」

OpenAI在机器人领域的战略发生了显著转变,从早期通过投资试水大模型API应用,转向亲自研发机器人硬件,致力于实现软件与硬件的深度结合。为了让通用人工智能...

商汤信息图增强模型,论文图表、海报、菜谱、产品介绍等统统搞定

商汤日日新推出的SenseNova-U1-8B-MoT-Infographic信息图增强版模型,在8B参数规模上显著提升了人工智能信息图的生成能力,并取得了同级别最高评测分数。信息...

小学生画了撇胡子骗过AI年龄验证,硅谷工程师沉默了

为响应全球监管压力并保护未成年人,部分社交平台推出了默认未成年人模式,用户需通过年龄验证才能解锁成人功能。验证方式主要包括上传身份证件或使用设备端...
1 2 3 180