HPC 2024:上半年建 140 个智算中心,但实际需求正萎缩
文章摘要
【关 键 词】 高性能计算、智算融合、算力瓶颈、算力网、创新技术
在2024年9月24日至26日举行的第20届CCF全国高性能计算学术年会上,众多顶尖学者和行业专家共同探讨了高性能计算(HPC)领域面临的挑战和未来的发展趋势。会议主题为“华章廿载 新质未来”,强调了在智能化时代背景下,高性能计算与智能计算(智算)的融合趋势。
会议中,专家们指出了当前智算时代面临的一系列挑战,包括软硬件兼容性问题、训练集群故障、算力效率低下以及电力和空间限制等。中国工程院院士邬江兴特别指出,依赖电力来提升算力的发展模式是不可持续的。
在探讨解决方案时,专家们提出了多种创新思路,如高通量以太网(ETH+)、晶圆级变结构计算和类脑算力等。晶圆级变结构计算被认为能够解决性能增长与算力需求之间的矛盾,提高计算效率,并减少带宽、时延和单位算力密度的损失。类脑处理器(BPU)则因其在处理非结构化数据方面的高效率而受到关注。
“超智融合”成为会议的热点话题,预示着超算和智算的融合将成为解决国内计算瓶颈的关键路径。清华大学计算机系教授陈文光提出,将超算领域的经验移植到智算领域,通过超智融合来提升算力。并行科技董事长陈健也认为,AI大模型训练的需求暴涨,需要超级计算机的支持。
此外,算力网的概念也引起了广泛关注。算力网旨在实现算力中心资源的有效连接和共享,被视为解决算力瓶颈的可行方案。中国工程院院士李国杰提出,算力网应像浏览器和微信一样普及,以满足智能时代的基础设施需求。
在算力网的构建上,需要解决资源空间的统一命名、运行式抽象、统一编程方法和系统性评价算力网性能等问题。目前,算力提供商、政府和学界都在积极推动算力网的建设,包括云网融合、算力枢纽中心的建设以及分布式计算的基础研究。
会议还讨论了算力网的未来发展,包括为中小模型单位提供合适的算力,以及随着推理需求的增长,算力网可能需要升级到2.0版本。总体而言,会议强调了超算与智算融合的重要性,以及算力网在推动计算资源有效利用和提升算力效率方面的潜力。
原文和模型
【原文链接】 阅读原文 [ 4006字 | 17分钟 ]
【原文作者】 AI科技评论
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★