标签：AI集群

替代HBM，微软探索新方案

AI集群中高带宽内存（HBM）的局限性促使微软研究院团队提出一种新型内存——托管保留内存（MRM）。MRM旨在更有效地存储AI推理工作负载的关键数据结构，通过放弃...

AIGC动态

8个月前

Inflection-2.5：性能可与GPT-4和Gemini相媲美的大模型

近期，Inflection AI 在大型语言模型（LLM）领域取得了显著进展，其推出的Inflection-2.5模型在性能上与 OpenAI 的 GPT-4 和 Google 的 Gemini 等顶尖 LLM 相...

AIGC动态

2年前 (2024)