英伟达竞品来了,训练比H100快70%,英特尔发最新AI加速卡

英伟达竞品来了,训练比H100快70%,英特尔发最新AI加速卡

 

文章摘要


【关 键 词】 英特尔Gaudi 3AI加速器性能对比技术升级

大会上,<英特尔>展示了其子公司的最新一代人工智能加速器,预计将于<2024年第三季度>推出。Gaudi 3的亮点在于其<1835 TFLOPS>的,<英特尔>认为这足以让其在占有一席之地。内部基准测试显示,在性能上超过了<英伟达>的,并且在能耗比上更胜一筹。Gaudi 3的发布标志着<英特尔>AI加速器产品的<战略调整>,将定位为<旗舰产品>。

是基于<台积电5nm工艺>的的直接演进,增加了计算硬件,包括<矩阵数学引擎>和<张量核心>。Gaudi 3的达到<1835 TFLOPS>,是的两倍,格式的算力提升了四倍。在<大型语言模型训练>上,的性能显著优于<英伟达>的

采用了<双芯配置>,两个相同的芯片通过<高带宽链路>连接,提供统一的<内存地址空间>。芯片使用,提供最高<128GB>的内存和<3.7TB/秒>的内存带宽。此外,芯片还具有<48MB板载SRAM>,总带宽为<12.8TB/秒>。

在<网络连接>方面,得到了显著升级,每块芯片提供<24个200Gb/秒>的以太网链路,总带宽达到<8.4TB/秒>。<英特尔>还开发了多达<512个节点>的<网络拓扑>,以支持大型的<集群训练>。

<性能对比>方面,在<16个加速器集群>中训练时,性能比快<70%>。推理性能提高了<1.3至1.5倍>,功耗比提高了多达<2.3倍>。<英特尔>也是唯一一个提供的主要硬件制造商,这显示了其在<行业标准测试>方面的<透明度>。

<英特尔>将在<下个季度>发布,提供<风冷和液冷版本>的样品。此外,<英特尔>还将推出采用传统,这将为需要在传统中即插即用的客户提供便利。预计将于<今年第四季度>推出。

原文和模型


【原文链接】 阅读原文 [ 2125字 | 9分钟 ]
【原文作者】 机器之心
【摘要模型】 gpt-4
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...