英伟达AI算力的五个层次,2024年GTC大会GB200技术全拆解!

AIGC动态6个月前发布 admin
1,043 0 0
英伟达AI算力的五个层次,2024年GTC大会GB200技术全拆解!

 

文章摘要


【关 键 词】 英伟达Blackwell AI算力提升高速互联并行计算

根据文章内容,可以总结如下:

1. 英伟达在2024GTC大会上发布了全新的Blackwell AI芯片,研发成本高达100亿美元。该芯片具有非常强大的性能,在单芯片层面就已经达到了800mm²的面积,包含600个SM单元,单芯片算力达到了10PFLOPS。Blackwell的两个Die通过高速NV-HBI技术互联,通信速度达到10TB/s,实现了双Die一个芯片的效果。Blackwell总共拥有2060亿个晶体管,支持8条HBM3e显存,总显存容量192GB,带宽8TB/s。

2. 为了满足大规模并行计算的需求,英伟达提出了GB200方案,包含2个Blackwell GPU和一个Grace CPU。2个GPU之间通过NVLINK互联,总FP8算力达到20PFLOPS。此外,英伟达还通过72卡互联实现了更高层次的算力,通过NVLink技术实现72个GPU的互联,实现了近1EFLOPS的算力。

3. 英伟达在Blackwell上的创新包括:单芯片算力、Die-to-Die互联、以及多卡互联三个层次的算力提升Blackwell通过芯片面积扩大、高速互联技术、以及NVLink多卡互联技术,实现了在单芯片和大规模并行计算领域的突破。这一创新使得英伟达在AI芯片领域具有更大的优势。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 5174字 | 21分钟 ]
【原文作者】 可鉴智库
【摘要模型】 glm-4
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...