标签:大模型
爆料:刚刚智谱AI发布新一代开源文生图模型
自2025年1月DeepSeek R1发布后,全球大模型行业进入激烈竞争阶段。作为中国最早布局大模型的创业公司,智谱AI凭借技术积累于近期推出突破性成果:基于Apache2...
中科院、百度提出新架构:突破参数限制,实现高效推理
针对大模型参数规模扩大与性能提升不匹配的挑战,中国科学院信息工程研究所联合百度与北京师范大学AI学院提出了Inner Thinking Transformer架构(ITT)。该架...
单月业绩破亿,10 亿热钱再狂砸智谱 AI!DeepSeek 掀起“AI 免费”风暴?唐杰:怎么想的呢!
3月3日,智谱华章宣布完成超10亿元人民币战略融资,由杭州城投产业基金和上城资本联合投资。该笔资金将重点投入国产基座GLM大模型的技术创新与生态建设,同时...
杭州国资参投,智谱完成超10亿元人民币战略融资|钛媒体AGI
国内AI大模型头部企业智谱近期获得杭州城投产业基金、上城资本等机构超10亿元战略投资,估值达到200亿元。本轮融资将重点推动其自主研发的GLM大模型技术创新...
杭州参投,智谱完成新一轮 10 亿元融资
近日,智谱完成超10亿元人民币的战略融资,投资方包括杭州城投产业基金、上城资本等,资金将用于推动GLM大模型技术创新及生态发展。该公司已在杭州成立浙江智...
智谱从 DeepSeek老家杭州融了一大笔钱
智谱近日宣布完成超10亿元人民币战略融资,投资方包括杭州城投产业基金和上城资本等机构。此次融资发生在DeepSeek引发全球AI行业价值重估的背景下,标志着地...
腾讯推出快思考模型:API 成本只有 deepseek 不到一半
腾讯混元团队近期推出自研快思考模型Turbo S,该模型通过架构创新实现首字时延降低44%,部署成本较前代模型下降数倍,定价仅为0.8元/百万tokens输入费用。该...
腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线
2月27日,腾讯混元自研快思考模型Turbo S正式发布,首字时延降低44%,吐字速度提升一倍,实现“秒回”级响应。该模型通过Hybrid-Mamba-Transformer混合架构创新...
得一微发布AI-MemoryX显存扩展技术,助力DeepSeek训推一体机
得一微电子推出的AI-MemoryX显存扩展解决方案,通过自研存储控制芯片和系统级创新,将单机显存容量从传统显卡的几十GB提升至10TB级别,解决了大模型微调训练...
超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!
阿里云旗下的视觉生成基座模型万相2.1(Wan)近日宣布开源,采用宽松的Apache2.0协议,公开了14B和1.3B两个参数规格的全部推理代码和权重。这一开源动作使得...