标签:大模型

DeepSeek 之后,大模型应用如何迈向新阶段?| AICon

春节期间,DeepSeek 在全球范围内引发了广泛关注,其开源特性、成本优势和回复准确率受到高度评价,推动了云计算领域的新热潮。企业纷纷接入 DeepSeek,导致...

千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷

法国大模型独角兽 Mistral AI 近期推出了其光学字符识别(OCR)产品 Mistral OCR,号称是“世界上最好的 OCR 模型”。该模型以图像和 PDF 作为输入,能够以前所...

DeepSeek创造历史!登顶全球AI应用第2名,豆包排名第10

全球著名投资基金Andreessen Horowitz(a16z)发布了2025年全球100生成式AI应用排行榜,分为网页版和移动版各50个应用。在网页版中,DeepSeek排名第二,仅次...

机器人到来前,智能汽车可能是更早服务人类的 AI Agent

在智能化转型的浪潮下,汽车行业正逐步深入AI领域,探索如何将AI技术与汽车产品深度融合。2025年被视为一个关键节点,众多车企纷纷接入DeepSeek等AI模型,宣...

DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek-R1作为AI产业颠覆式创新的代表,其训练与推理成本仅为同等性能大模型的数十分之一,核心在于多头潜在注意力网络(MLA)。MLA通过对键值缓存进行低秩...

阿里开源QwQ-32B,性能比肩R1。这是一次压倒性的创新。

阿里巴巴最新发布的推理模型QwQ-32B,以其320亿参数的规模,展现了与6710亿参数的DeepSeek-R1相媲美的性能。这一突破意味着,在更小的设备上运行更强大的推理...

爆料:刚刚智谱AI发布新一代开源文生图模型

自2025年1月DeepSeek R1发布后,全球大模型行业进入激烈竞争阶段。作为中国最早布局大模型的创业公司,智谱AI凭借技术积累于近期推出突破性成果:基于Apache2...

中科院、百度提出新架构:突破参数限制,实现高效推理

针对大模型参数规模扩大与性能提升不匹配的挑战,中国科学院信息工程研究所联合百度与北京师范大学AI学院提出了Inner Thinking Transformer架构(ITT)。该架...

单月业绩破亿,10 亿热钱再狂砸智谱 AI!DeepSeek 掀起“AI 免费”风暴?唐杰:怎么想的呢!

3月3日,智谱华章宣布完成超10亿元人民币战略融资,由杭州城投产业基金和上城资本联合投资。该笔资金将重点投入国产基座GLM大模型的技术创新与生态建设,同时...

杭州国资参投,智谱完成超10亿元人民币战略融资|钛媒体AGI

国内AI大模型头部企业智谱近期获得杭州城投产业基金、上城资本等机构超10亿元战略投资,估值达到200亿元。本轮融资将重点推动其自主研发的GLM大模型技术创新...
1 11 12 13 14 15 54