标签:大模型

视远 · 正心明智——「AI 中国」机器之心2025年度评选正式揭晓

2025年标志着人工智能领域尤其是大模型技术的显著突破与行业格局的深刻变革。全球范围内,GPT-5和Gemini 3等新一代模型通过架构创新与训练范式升级,在理解、...

阶跃星辰深度研究32B媲美Gemini深度研究能力,成本不到1/10

训练管线采用三阶段渐进式设计:代理式中间训练聚焦32K-128K上下文长度下的原子能力培养;监督微调阶段连接孤立能力形成端到端任务处理链条;强化学习阶段通...

下载量超 1300 万,昇思 MindSpore:AI 框架迈入“超节点时代”

昇思MindSpore社区在开源五周年之际公布了显著的发展成果:累计下载量突破1300万次,核心贡献开发者超过5.2万人,代码核入量达12万次,服务全球150多个国家和...

Manus被收购,智谱也定了8天后上市

Meta收购Manus的消息余波未平,智谱华章科技股份有限公司(智谱)正式启动港股招股程序,计划于2026年1月8日以股票代码“2513”挂牌上市。根据招股安排,智谱拟...

大模型幻觉的源头找到了!清华团队锁定大模型宁愿说谎也要讨好人类的神经元

清华大学研究团队首次确认了大语言模型中存在与幻觉直接关联的特定神经元(H-Neurons),揭示了幻觉产生的底层神经机制。 研究发现,在数十亿参数的模型中,...

通义百聆,再掀 AI 硬件淘金潮

沉寂已久的语音大模型市场在2025年迎来爆发式复苏,硬件产品销量突破百万标志着语音AI成为大模型落地最成功的领域之一。AI转录笔、智能耳机等专用硬件品类率...

Minimax M2.1 实测,Coding 多语言能力迎来重大突破

MiniMax M2.1作为大模型领域的新一代产品,展现了在多语言编程和跨平台开发能力上的显著突破。其核心价值已从“高性价比工具”转向“深度专业生产力”,尤其在复...

MiniMax 港股 IPO 背后:被低估与被错读的中国大模型

MiniMax作为一家成立仅四年的AI创业公司,凭借全模态技术布局和独特的商业模式,迅速跻身全球大模型第一梯队。2025年12月港交所招股书披露显示,其2024年营收...

“大模型第一股”打响上市前哨战!智谱GLM-4.7 刷新开源编程SOTA,修复代码、终端操作表现超Claude 4.5

智谱公司发布新一代大模型GLM-4.7,该模型主要提升编程与代理式任务能力,同时在推理等方面有所增强。当前大模型的发展重点已从“会答题”转向“能干活”,评测体...

仅需15%全量Attention!「RTPurbo」阿里Qwen3长文本推理5倍压缩方案来了

长序列处理已成为大模型应用中最昂贵的资源消耗点。当前主流Full Attention机制下,计算开销随输入长度呈平方级增长,导致长文本处理既昂贵又低效。针对这一...
1 2 3 71