图像生成

图像,绘画

Coding Plan 只是过渡。

针对早期模型调用成本难以预估的行业痛点,市场曾广泛采用按梯度划分调用额度的编程类算力订阅模式。随着生成式人工智能向复杂任务场景延伸,服务形态迅速从...

160行代码读懂LeCun的JEPA世界模型

开发者基于单文件架构完整实现了五种核心模型变体,覆盖图像处理、视频序列解析、轨迹追踪及自回归世界构建等多类场景。该项目旨在剥离工业级流水线的复杂冗...

Codex更新远程控制,你也终于可以在手机上随时随地Vibe Coding了。

实际使用轨迹显示,编程辅助偏好已由单一工具主导演变为多平台协同策略。该系统在日常连接稳定性与账户存续管理方面表现突出,长时间运行期间极少触发异常风...

谷歌Android重大更新!底层植入Gemini,苹果已掉队

移动通信设备的操作系统正经历从传统硬件堆叠向意图驱动体验的深刻转型。智能手机生态长期受限于应用孤岛模式,用户被迫在不同独立软件间频繁切换以处理日常...

手机跑多模态也能快到飞起!面壁MiniCPM-V 4.6开源

大模型技术正加速向移动终端演进,实现复杂图文与视频任务的本地化实时处理。MiniCPM-V 4.6作为一款专为端侧部署深度优化的多模态模型,依托视觉编码器与轻量...

挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改

字节商业化技术团队近期提出全新视觉生成架构生成精炼网络,为图像与视频自动化创作开辟出独立于主流扩散模型与自回归模型的第三种技术路线。该架构创新性采...

清华系团队出手!一张 4090 即可「爆改」,1.3B小钢炮震撼开源

面壁智能联合清华大学及开源社区正式发布了端侧多模态大模型MiniCPM-V 4.6,该模型仅具备约1.3B参数规模,却在多模态性能与运行效率上实现了对同级别主流模型...

去掉 VAE 之后,商汤用 8B 参数重新定义了开源生图的上限

商汤推出的SenseNova U1系列模型基于自研的NEO-unify架构,彻底摒弃传统视觉编码器与变分自编码器,直接在像素与文本层面实现端到端协同学习。该设计突破了多...

全球AI Lab前十!Agnes新模型发布,以全模态+超低价定义模型性价比

全球人工智能产业竞争格局正呈现显著变化,传统头部企业主导的市场迎来全新参与者。Agnes AI近期在多项国际权威测评中表现突出,正式位列全球实验室综合排名...

炒菜、做实验、弹钢琴!Genesis最强“AI灵巧手”demo,寻找新的Scaling Law

Genesis AI发布的首个机器人基础模型GENE-26.5实现了以真实物理速度完成烹饪、移液、线束组装及乐器演奏等高复杂度任务的能力突破。测试过程中,模型能够自主...
1 2 3 177