老黄祭出新核弹B200!30倍H100单机可训15个GPT-4模型,AI迎新摩尔时代

AIGC动态8个月前发布 AIera
708 0 0

模型信息


【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

老黄祭出新核弹B200!30倍H100单机可训15个GPT-4模型,AI迎新摩尔时代
 

文章摘要


【关 键 词】 AI芯片Blackwell性能提升NVLinkAI平台

英伟达在GTC人工智能大会上发布了其最新一代性能巨兽——Blackwell B200 GPUGB200超级芯片。这款芯片被命名为Blackwell,以纪念著名数学家David Blackwell对博弈论和概率论的贡献。英伟达表示,Blackwell B200 GPU是当今世界上最强大的AI芯片,旨在实现普惠万亿参数的AI。

Blackwell B200 GPU拥有2080亿个晶体管,采用台积电4NP工艺节点,提供高达20 petaflops FP4的算力,是H100的5倍。GB200则是将两个B200 GPU与单个Grace CPU相结合,为LLM推理工作负载提供30倍的性能提升,同时显著提高效率。与H100相比,GB200的成本和能耗降低了25倍。

Blackwell芯片的关键改进之一是采用了第二代Transformer引擎,对每个神经元使用4位(20 petaflops FP4)而非8位,将算力、带宽和模型参数规模提高了一倍。此外,英伟达还推出了第五代NVLink网络技术,增强了数万亿参数AI模型的性能,提供了突破性的每GPU双向吞吐量,促进了无缝高速通信。

Blackwell GPU还增加了对FP4和FP6的支持,并配备了RAS引擎,以确保系统的可靠性、可用性和可维护性。英伟达表示,过去8年计算规模扩展已经增加了1000倍。

Blackwell超级芯片的发布,使得英伟达不再仅仅是芯片供应商,而是成为了一个平台提供商,类似于微软苹果。英伟达推出了新的AI推理微服务NIM,旨在让全世界用上AI。NIM使得在英伟达的任何GPU上运行程序变得更容易,即使是旧GPU。这将增加客户使用英伟达芯片的粘性,并降低运行AI模型的成本。

GB200 NVL72是将36个Grace CPU和72个Blackwell GPU集成到一个液冷机柜中,可实现总计720 petaflops的AI训练性能,或是1,440 petaflops(1.4 exaflops)的推理性能。这种架构可以为平台中的每个GPU提供高达每秒1,800 GB的带宽。英伟达还发布了统一的超算平台DGX B200,用于AI模型训练、微调和推理。

自从ChatGPT掀起AI热潮以来,英伟达的股价已经上涨了五倍,总销售额增长了两倍多。亚马逊谷歌微软已经成为最新芯片超算的首批用户。英伟达的新软件NIM支持跨多个领域的AI用例,包括LLMs视觉语言模型(VLM)以及用于语音、图像、视频、3D、药物发现、医学成像等的模型。

原文信息


【原文链接】 阅读原文
【阅读预估】 2517 / 11分钟
【原文作者】 新智元
【作者简介】 智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。

© 版权声明

相关文章

暂无评论

暂无评论...