标签:AI集群

替代HBM,微软探索新方案

AI集群中高带宽内存(HBM)的局限性促使微软研究院团队提出一种新型内存——托管保留内存(MRM)。MRM旨在更有效地存储AI推理工作负载的关键数据结构,通过放弃...

Inflection-2.5:性能可与GPT-4和Gemini相媲美的大模型

近期,Inflection AI 在大型语言模型(LLM)领域取得了显著进展,其推出的Inflection-2.5模型在性能上与 OpenAI 的 GPT-4 和 Google 的 Gemini 等顶尖 LLM 相...