图像生成

图像,绘画

I/O大会开完,谷歌连搜索框都变智能体了

谷歌I/O大会正式确立了向全天候智能体时代转型的核心战略,大模型行业竞争焦点已从基准测试榜单全面转向工程落地与规模化应用。当前全球用户通过谷歌渠道每月...

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

谷歌近期产品发布会全面展示了以人工智能为核心的技术演进与生态布局。此次发布的核心主线围绕模型能力迭代、智能体系统构建以及跨平台生态整合展开。在模型...

复旦可信具身智能研究院&上海交大:给自动驾驶装上可检索的「空间记忆」丨CVPR 2026

自动驾驶系统在夜间、雨雾或复杂路口等低能见度场景中,常因实时传感器受限而难以准确理解道路空间。针对这一瓶颈,研究团队提出引入离线地理信息作为可检索...

抢先李飞飞!世界模型能多人联机玩FPS游戏了

Odyssey团队推出基于通用世界模型Agora-1的多人第一人称射击体验,该应用完全摒弃传统游戏引擎、物理规则与预设渲染代码,所有画面与场景均由算法实时演算生...

无需构造偏好对:TGO用标量反馈对齐视觉生成模型|ICML’26

生成模型的偏好对齐正在从传统的成对比较转向利用标量反馈的新阶段。过往主流算法依赖成对偏好数据进行训练,虽结构优雅且计算高效,但将真实场景中连续的多...

Coding Plan 只是过渡。

针对早期模型调用成本难以预估的行业痛点,市场曾广泛采用按梯度划分调用额度的编程类算力订阅模式。随着生成式人工智能向复杂任务场景延伸,服务形态迅速从...

160行代码读懂LeCun的JEPA世界模型

开发者基于单文件架构完整实现了五种核心模型变体,覆盖图像处理、视频序列解析、轨迹追踪及自回归世界构建等多类场景。该项目旨在剥离工业级流水线的复杂冗...

Codex更新远程控制,你也终于可以在手机上随时随地Vibe Coding了。

实际使用轨迹显示,编程辅助偏好已由单一工具主导演变为多平台协同策略。该系统在日常连接稳定性与账户存续管理方面表现突出,长时间运行期间极少触发异常风...

谷歌Android重大更新!底层植入Gemini,苹果已掉队

移动通信设备的操作系统正经历从传统硬件堆叠向意图驱动体验的深刻转型。智能手机生态长期受限于应用孤岛模式,用户被迫在不同独立软件间频繁切换以处理日常...

手机跑多模态也能快到飞起!面壁MiniCPM-V 4.6开源

大模型技术正加速向移动终端演进,实现复杂图文与视频任务的本地化实时处理。MiniCPM-V 4.6作为一款专为端侧部署深度优化的多模态模型,依托视觉编码器与轻量...
1 2 3 178