图像生成

图像,绘画

CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力

预测性策略在机器人操作任务中能提升性能,但让世界模型预测机器人与物体交互的精确未来状态仍是挑战。国防科大、北京大学、深圳大学团队提出 LaDi - WM 模型...

Figma 如何使用 AI 来支持而不是取代设计师

Figma在其设计平台集成AI,带来诸多变革与创新。非技术人员借助其AI功能,能在数小时内构建原型,部分代码精确到可让工程师直接投入生产,且设计师始终掌控最...

智谱AI、清华开源新视觉大模型:刷新41项纪录,同级别最强

智谱AI与清华大学联合开源最新视觉大模型GLM - 4.5V,其在多个领域表现卓越。测试数据显示,GLM - 4.5V在42项主流测试中创造41项新记录,尤其在视觉智能体方...

吞下17亿图片,Meta最强巨兽DINOv3开源!重新定义CV天花板

Meta训练出70亿参数的「视觉巨兽」DINOv3,通过自监督学习(SSL)训练可生成强大且高分辨率的图像特征,在多个密集预测任务中超越专用解决方案,重新定义计算...

Meta刚刚开源DINOv3,横扫60+任务,无标注封神!

今天凌晨,全球社交、科技巨头Meta开源了最新视觉大模型DINOv3,其主要创新在于使用自我监督学习,无需标注数据,能大幅降低训练所需时间和算力资源。- 模型...

Tape-out生死时速:华大九天Argus重塑大规模SoC芯片物理验证效率!

芯片设计团队在物理验证阶段常面临诸多难题,如验证时间长、错误信息多等。华大九天的Argus为这一困境带来了转机,重塑了物理验证工作方式。验证速度与效率大...

AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」

AI界近期聚焦GPT - 5和谷歌Genie 3,微软则悄然将Edge进化为AI浏览器。Edge此前风评不佳,2025年其首页仍充斥着MSN资讯等内容,且不断添加“无用新功能”致系统...

除了Qwen,阿里还有什么好东西?

8月5日,阿里巴巴通义千问团队开源Qwen - Image文生图模型,该模型针对中文复杂排版与高精度图像编辑优化,引发开发者对其与万相系列模型功能是否重复的疑问...

解决扩散模型过拟合的创新框架T-LoRA

随着预训练大型文本到图像扩散模型发展,企业和个人开发者探索通过少量样本对模型定制化,但面临训练样本有限时模型过度拟合问题,导致生成图像缺乏多样性和...

破解 AI 创企的「不可能三角」,解药不止「大模型」

在AI技术快速发展的背景下,行业竞争正从单纯的技术指标竞赛转向更深层次的生态构建与服务。百度集团副总裁袁佛玉在AI DAY现场指出,AI创企面临技术深度、迭...
1 2 3 4 139