老黄祭出新核弹B200！30倍H100单机可训15个GPT-4模型，AI迎新摩尔时代

AIGC动态2年前 (2024)发布 AIera

2,192 0 0

模型信息

【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

文章摘要

【关键词】 AI芯片、Blackwell、性能提升、NVLink、AI平台

英伟达在GTC人工智能大会上发布了其最新一代性能巨兽——Blackwell B200 GPU和GB200超级芯片。这款芯片被命名为Blackwell，以纪念著名数学家David Blackwell对博弈论和概率论的贡献。英伟达表示，Blackwell B200 GPU是当今世界上最强大的AI芯片，旨在实现普惠万亿参数的AI。

Blackwell B200 GPU拥有2080亿个晶体管，采用台积电4NP工艺节点，提供高达20 petaflops FP4的算力，是H100的5倍。GB200则是将两个B200 GPU与单个Grace CPU相结合，为LLM推理工作负载提供30倍的性能提升，同时显著提高效率。与H100相比，GB200的成本和能耗降低了25倍。

Blackwell芯片的关键改进之一是采用了第二代Transformer引擎，对每个神经元使用4位（20 petaflops FP4）而非8位，将算力、带宽和模型参数规模提高了一倍。此外，英伟达还推出了第五代NVLink网络技术，增强了数万亿参数AI模型的性能，提供了突破性的每GPU双向吞吐量，促进了无缝高速通信。

Blackwell GPU还增加了对FP4和FP6的支持，并配备了RAS引擎，以确保系统的可靠性、可用性和可维护性。英伟达表示，过去8年计算规模扩展已经增加了1000倍。

Blackwell超级芯片的发布，使得英伟达不再仅仅是芯片供应商，而是成为了一个平台提供商，类似于微软、苹果。英伟达推出了新的AI推理微服务NIM，旨在让全世界用上AI。NIM使得在英伟达的任何GPU上运行程序变得更容易，即使是旧GPU。这将增加客户使用英伟达芯片的粘性，并降低运行AI模型的成本。

GB200 NVL72是将36个Grace CPU和72个Blackwell GPU集成到一个液冷机柜中，可实现总计720 petaflops的AI训练性能，或是1,440 petaflops（1.4 exaflops）的推理性能。这种架构可以为平台中的每个GPU提供高达每秒1,800 GB的带宽。英伟达还发布了统一的超算平台DGX B200，用于AI模型训练、微调和推理。

自从ChatGPT掀起AI热潮以来，英伟达的股价已经上涨了五倍，总销售额增长了两倍多。亚马逊、谷歌、微软已经成为最新芯片超算的首批用户。英伟达的新软件NIM支持跨多个领域的AI用例，包括LLMs、视觉语言模型（VLM）以及用于语音、图像、视频、3D、药物发现、医学成像等的模型。

原文信息

【原文链接】 阅读原文
【阅读预估】 2517 / 11分钟
【原文作者】 新智元
【作者简介】 智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。