文章摘要
【关 键 词】 英特尔、Gaudi 3、AI加速器、性能对比、技术升级
在大会上,<英特尔>展示了其子公司的最新一代人工智能加速器,预计将于<2024年第三季度>推出。Gaudi 3的亮点在于其<1835 TFLOPS>的,<英特尔>认为这足以让其在占有一席之地。内部基准测试显示,在性能上超过了<英伟达>的,并且在能耗比上更胜一筹。Gaudi 3的发布标志着<英特尔>AI加速器产品的<战略调整>,将定位为<旗舰产品>。
是基于<台积电5nm工艺>的的直接演进,增加了计算硬件,包括<矩阵数学引擎>和<张量核心>。Gaudi 3的达到<1835 TFLOPS>,是的两倍,格式的算力提升了四倍。在<大型语言模型训练>上,的性能显著优于<英伟达>的。
采用了<双芯配置>,两个相同的芯片通过<高带宽链路>连接,提供统一的<内存地址空间>。芯片使用,提供最高<128GB>的内存和<3.7TB/秒>的内存带宽。此外,芯片还具有<48MB板载SRAM>,总带宽为<12.8TB/秒>。
在<网络连接>方面,的得到了显著升级,每块芯片提供<24个200Gb/秒>的以太网链路,总带宽达到<8.4TB/秒>。<英特尔>还开发了多达<512个节点>的<网络拓扑>,以支持大型的<集群训练>。
<性能对比>方面,在<16个加速器集群>中训练时,性能比快<70%>。推理性能提高了<1.3至1.5倍>,功耗比提高了多达<2.3倍>。<英特尔>也是唯一一个提供的主要硬件制造商,这显示了其在<行业标准测试>方面的<透明度>。
<英特尔>将在<下个季度>发布,提供<风冷和液冷版本>的样品。此外,<英特尔>还将推出采用传统的,这将为需要在传统中即插即用的客户提供便利。的预计将于<今年第四季度>推出。
原文和模型
【原文链接】 阅读原文 [ 2125字 | 9分钟 ]
【原文作者】 机器之心
【摘要模型】 gpt-4
【摘要评分】 ★★★★★