图像生成

图像,绘画

不做“传统机器人公司”的智元发了个大模型,要让机器人看视频就能进化

智元机器人发布了通用具身基座大模型——智元启元大模型(GO-1),展示了其通过模仿人类操作完成家务任务的能力,如倒水和制作吐司早餐。GO-1的核心功能依赖于V...

Mistral AI 发布号称最强 OCR API:能解锁 90% 非结构化数据,1 美元搞定 2000 页文档

法国 AI 明星创企 Mistral AI 发布了一款名为 Mistral OCR 的光学字符识别(OCR)API,旨在帮助企业更高效地处理和理解各种文档。该 API 能够从非结构化的 PD...

二次元AI新玩具破圈走红!短短几个月100万MAU

二次元圈子近期出现了一款名为“狸谱”的AI应用,迅速在年轻群体中走红。这款应用不仅能够生成高质量的二次元图像,还提供了丰富的互动功能,满足了用户对虚拟...

MIT 最新扩散模型课程:从微分方程探索 AIGC 的边界

MIT计算机系教授Peter Holderrieth和Ezra Erives在其最新课程系列“Generative AI with Stochastic Differential Equations”中,深入探讨了生成式人工智能(AI...

准博士生把导师履历论文输入ChatGPT,制成「AI评委」!顺利通过资格考试

美国学生发现了ChatGPT的创意新用途,展示了其在学术和日常生活中的多样化应用。2024年8月,University of Colorado的生物医学博士生候选人Adriana Ivich在准...

GDC 2025全球开发者大会回顾:算法与算力的双重革新

全球开发者大会(GDC)2025年在上海召开,聚焦人工智能技术的最新突破,围绕算法与算力两大核心议题展开深入探讨。大会吸引了全球顶尖的开发者、技术专家和产...

DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布

生成式AI技术正在全球范围内迅速崛起,对多个行业产生了深远影响。SimilarWeb发布的「全球生成式AI行业趋势」报告显示,过去12周内,AI工具的整体增速约为20%...

千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷

法国大模型独角兽 Mistral AI 近期推出了其光学字符识别(OCR)产品 Mistral OCR,号称是“世界上最好的 OCR 模型”。该模型以图像和 PDF 作为输入,能够以前所...

强化学习成帮凶,对抗攻击LLM有了新方法

威斯康星大学麦迪逊分校的研究团队最近发现,强化学习可以被用于实施黑盒逃避攻击,即通过生成对抗样本来欺骗机器学习模型。这一发现揭示了强化学习在攻击AI...

仅1/70的数据量,多模态检索效果却更优! 智源发布BGE-VL,合成数据立大功

智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了BGE系列模型的生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最...
1 10 11 12 13 14 121