文章摘要
【关 键 词】 计算发展、人工智能、显卡性能、市场领先、技术突破
Nvidia在计算、网络和图形发展史上占据独特地位,目前手握大量资金,并因其架构、工程和供应链优势在生成式人工智能市场处于领先。尽管起初Nvidia并无必要扩展到数据中心计算领域,但高性能计算(HPC)研究者和人工智能(AI)研究者利用其GPU计算创造了全新市场,实现了四十年来让机器真正具备思考能力的梦想。
文章强调,生成式人工智能的关键在于规模,Nvidia通过大幅提升GPU性能,降低大型语言模型响应中的token能量成本,推动了如ChatGPT这样的技术突破。从“Pascal”到“Blackwell”的八年间,GPU性能提升了1053倍,部分是通过降低浮点精度实现的。
Nvidia不仅面对提升性能的挑战,还需降低系统成本。在摩尔定律末期,每代GPU的价格上涨,但性能提升显著。例如,Blackwell B100 GPU的预计售价高达35,000至40,000美元,而Nvidia需在约10,000个GPU上用大约10天时间来训练GPT-4 1.8T MoE模型。
文章探讨了Nvidia的平台路线图,展示了从Hopper到Blackwell再到Rubin的未来发展。Nvidia预计将通过增加HBM内存堆叠、提升内存容量和带宽,以及配备更快网络接口卡和交换机来持续提高性能。
面对未来,Nvidia和其竞争对手及客户都无法抵挡生成式人工智能带来的利润和生产力承诺。凭借其资金实力,Nvidia将加速突破极限,推动技术进步。文章最后指出,到2026年及以后,Nvidia将推出使用HBM4内存的Rubin GPU,以及可能融合InfiniBand和以太网ASIC的新交换机产品,持续引领行业创新发展。
原文和模型
【原文链接】 阅读原文 [ 3705字 | 15分钟 ]
【原文作者】 半导体行业观察
【摘要模型】 glm-4
【摘要评分】 ★★★★★