图像生成

图像,绘画

刚刚,谷歌用更少参数打败 Qwen 2.5-32B!新模型 Gemma 3 号称“单 GPU 模型王”,团队紧急招兵买马!

谷歌近日发布了Gemma 3,这是一组轻量级的开源AI模型,旨在减少能源消耗和成本,同时提供高性能的推理能力。Gemma 3基于与Gemini 2.0相同的研究和技术构建,...

字节首次公开图像生成基模技术细节!数据处理到RLHF全流程披露

字节跳动旗下的豆包大模型团队近期在 arXiv 上发布了一篇技术报告,详细介绍了其文生图模型 Seedream 2.0 的技术细节。该模型于去年 12 月上线至豆包 APP 和...

不做“传统机器人公司”的智元发了个大模型,要让机器人看视频就能进化

智元机器人发布了通用具身基座大模型——智元启元大模型(GO-1),展示了其通过模仿人类操作完成家务任务的能力,如倒水和制作吐司早餐。GO-1的核心功能依赖于V...

Mistral AI 发布号称最强 OCR API:能解锁 90% 非结构化数据,1 美元搞定 2000 页文档

法国 AI 明星创企 Mistral AI 发布了一款名为 Mistral OCR 的光学字符识别(OCR)API,旨在帮助企业更高效地处理和理解各种文档。该 API 能够从非结构化的 PD...

二次元AI新玩具破圈走红!短短几个月100万MAU

二次元圈子近期出现了一款名为“狸谱”的AI应用,迅速在年轻群体中走红。这款应用不仅能够生成高质量的二次元图像,还提供了丰富的互动功能,满足了用户对虚拟...

MIT 最新扩散模型课程:从微分方程探索 AIGC 的边界

MIT计算机系教授Peter Holderrieth和Ezra Erives在其最新课程系列“Generative AI with Stochastic Differential Equations”中,深入探讨了生成式人工智能(AI...

准博士生把导师履历论文输入ChatGPT,制成「AI评委」!顺利通过资格考试

美国学生发现了ChatGPT的创意新用途,展示了其在学术和日常生活中的多样化应用。2024年8月,University of Colorado的生物医学博士生候选人Adriana Ivich在准...

GDC 2025全球开发者大会回顾:算法与算力的双重革新

全球开发者大会(GDC)2025年在上海召开,聚焦人工智能技术的最新突破,围绕算法与算力两大核心议题展开深入探讨。大会吸引了全球顶尖的开发者、技术专家和产...

DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布

生成式AI技术正在全球范围内迅速崛起,对多个行业产生了深远影响。SimilarWeb发布的「全球生成式AI行业趋势」报告显示,过去12周内,AI工具的整体增速约为20%...

千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷

法国大模型独角兽 Mistral AI 近期推出了其光学字符识别(OCR)产品 Mistral OCR,号称是“世界上最好的 OCR 模型”。该模型以图像和 PDF 作为输入,能够以前所...
1 24 25 26 27 28 135