文章摘要
【关 键 词】 人工智能、GPU、数据中心、AI芯片、计算分布
随着人工智能技术的快速发展,GPU成为了AI训练和推理的关键组件。全球AI数据中心的建设成本高昂,通常需要数十亿美元的投资,这使得只有科技巨头和一些财力雄厚的国家能够参与其中。地缘政治的重要性随着对高端芯片需求的增加而日益凸显,各国和地区开始囤积芯片,并实施制裁措施限制尖端芯片的购买。然而,全球人工智能芯片的确切分布数据却相对缺乏。
牛津大学互联网研究所的Vili Lehdonvirta教授指出,GPU主要集中在全球30个国家,美国和中国处于领先地位,而其他地区则几乎没有GPU资源。全球AI计算供应链可以分为四个部分:设计和销售AI芯片的公司、制造和封装芯片的公司、部署芯片提供计算能力的公司以及消耗计算能力开发或部署AI系统的公司。Nvidia、台积电(TSMC)和ASML是这些环节的领导者,但供应链在地理和所有权上高度集中。
研究重点关注了公共云AI计算的地理分布,包括科学超级计算设施、私人计算集群和公共云计算提供者。中国的超级计算机数量最多,但大多数并非专为AI模型训练设计。当前AI发展的繁荣主要依赖于私人计算集群和公共云计算,尤其是超大规模计算提供者如AWS、Microsoft Azure、Google Cloud、阿里巴巴和腾讯。
研究普查了六大超大规模公共云提供商,发现世界上大多数国家没有公共云区域,而拥有云区域的国家中,30个国家的云区域支持GPU。中国和美国在GPU支持区域的数量上几乎与世界其他国家总和相当。美国在不同类型实例的可用比例和绝对数量上都拥有世界上最新和最强大的GPU。
美国在先进公共云AI计算方面的领先地位可能与其政府的出口管制有关,这些管制禁止向中国出口A100和H100芯片。除了出口管制,创新扩散的摩擦、初始需求结构的地理差异以及规模经济可能也是美国领先的原因。此外,一些国家如日本、英国和法国拥有与V100支持区域数量相同的A100支持区域,这可能与本地AI开发活动有关。
研究还探讨了私有和政府计算的全球分布,以及新的私有计算集群的增长。政府拥有的计算设施和私有计算集群可能对当前的计算地理格局构成挑战。研究指出,计算基础设施的地理分布不均,这影响了不同国家利用计算作为AI干预点的可能性。美国和中国在芯片质量上的竞争,以及其他国家在计算能力上的差异,形成了“计算北方”和“计算南方”的概念,以及缺乏任何公共云AI计算的“计算沙漠”。
最后,研究提出了一个问题:谁拥有最多的GPU?这个问题背后反映了算力的不均匀分布。改善这种不平衡,让更多人享受到AI带来的便利,是一个长期且复杂的挑战。研究的结论是,如果地理模式是由先行者优势和规模经济导致的路径依赖,那么计算生产的地理集中和区域专业化可能成为持久特征。
原文和模型
【原文链接】 阅读原文 [ 5829字 | 24分钟 ]
【原文作者】 半导体行业观察
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★