文章摘要
【关 键 词】 AI芯片、网络互连、数据中心、高性能I、O、技术创新
Enfabrica Corp.,一家成立于2020年的初创公司,因其在AI网络芯片领域的创新而受到业界关注。公司的核心理念是数据中心网络结构必须适应底层计算范式的变革,以支持更并行、加速、异构和数据移动密集的计算需求。Enfabrica在2023年9月的B轮融资中筹集了1.25亿美元,投资者包括英伟达等,而在2024年11月,公司又完成了C轮融资,获得1.15亿美元,投资方包括Arm、思科、三星等。
Enfabrica的AI网络互连芯片ACF-S(Accelerated Compute Fabric-Switch)旨在解决GPU网络的痛点,以及内存和存储扩展问题,特别是在加速计算的扩展挑战方面。随着大语言模型和AI代理的需求增长,Enfabrica的技术显示出其商业可行性和潜在价值。
在现代AI服务器和数据中心中,网络连接技术至关重要。Infiniband、OmniPath、Slingshot等技术主要用于服务器间的横向连接。AI训练过程中,通信阶段的尾部延迟成为系统性能的关键指标,网络通信需要能够传输更多数据。Enfabrica的ACF-S芯片通过集成CXL/PCIe交换功能和RNIC功能到单一设备中,消除了对PCIe、NIC或独立CPU连接DRAM的需求,提供了一种新的网络互连解决方案。
ACF-S芯片采用100%基于标准的硬件和软件接口,能够直接桥接和互连GPU、CPU、加速器、内存和网络等设备,提供可扩展、流式、每秒多TB的数据传输。这种设计减少了设备数量、I/O延迟跳跃和设备功率消耗,同时降低了成本。Enfabrica声称,其技术可以将大型语言模型推理的GPU计算成本降低约50%,深度学习推荐模型推理的GPU计算成本降低75%。
2024年11月,Enfabrica宣布其3.2太比特/秒ACF SuperNIC芯片“Millennium”及其试点系统Thames全面上市,提供多端口800千兆以太网连接,带宽和多路径弹性是业内其他产品的四倍。Millennium芯片将于2025年第一季度开始批量供货,其高基数、高带宽和并发PCIe/以太网多路径和数据移动功能,可以独特地在每个服务器系统中纵向和横向扩展四到八个最新一代GPU,为AI集群带来前所未有的性能、规模和弹性。
Enfabrica的技术被认为可能改变AI网络领域,目前由Nvidia及其Mellanox解决方案主导。Enfabrica的优势在于它能够在GPU和CPU之间高速移动数据,这可能使更多公司探索使用CPU而不是GPU来开发人工智能。随着AI模型训练对效率和成本效益的要求提高,Enfabrica的技术显示出其在数据中心高性能I/O领域的重要性和市场潜力。
原文和模型
【原文链接】 阅读原文 [ 3583字 | 15分钟 ]
【原文作者】 半导体行业观察
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★