标签：集群

RL后训练步入超节点时代！华为黑科技榨干算力，一张卡干俩活

在大模型竞赛日益激烈的背景下，强化学习后训练（RL后训练）已成为突破大语言模型（LLM）性能瓶颈的关键路径。OpenAI o1、DeepSeek-R1等模型的成功，均得益于...

AIGC动态

3个月前

专为训练Llama 3，Meta 4.9万张H100集群细节公布

这篇文章报道了Meta公司推出的两个24k GPU集群，共计49152个H100 GPU，作为对人工智能领域的重大投资。Meta表示他们致力于开放计算和开源，并将使用这些算力...

AIGC动态

2年前 (2024)