清华大学汪玉：大模型能效提升，有几条必经之路？

AIGC动态1年前 (2024)发布 ai-front

2,615 0 0

文章摘要

在AICon全球人工智能开发与应用大会上，清华大学电子工程系教授汪玉发表了题为《可持续的智能：大模型高能效系统前瞻》的演讲，深入探讨了生成式AI时代下的能效挑战与解决方案。
汪玉教授指出，随着AI应用需求的增长，算力规模面临巨大挑战，能耗问题成为AI计算产业的核心竞争力。
他回顾了人工智能从计算智能、感知智能到认知智能的三个发展阶段，并分析了芯片行业如何通过设计通用处理器CPU和领域定制集成电路（ASIC）来实现人工智能算法的计算。
汪玉教授强调，AI 2.0时代的核心变化是从为每个应用类别开发专门算法模型转变为使用基础模型并对其进行微调以适应不同行业需求。
然而，这一转变带来了模型参数量的巨大增长，对硬件能力提出了更高要求。
面对美国对芯片出口的新管制规定，汪玉教授提到中国正努力推进自主芯片制造和工艺，以期在未来5至10年内解决相关问题。
汪教授特别强调了算法和电路协同优化的重要性，通过智能算法的可学习特性，实现了能效的数量级提升。
在具体实践中，汪玉教授展示了如何通过算法模型优化、数据结构优化、数据表示优化和算子优化等手段，提高大模型的能量效率。
在产业层面，汪玉教授讨论了AI 2.0时代的算力生态建设，包括清华大学人工智能学院的研究重点和中国算力中心的发展规划。
他提出，要充分利用中国的算力资源，需要在产品维度上实现大规模训练、小规模训练和微调以及大规模推理的优化。
最后，汪玉教授对未来的能效系统进行了展望，强调了算电融合的重要性，以及如何将算力中心与能源模型结合，优化用能效率并支持电力系统的绿色能源消纳和峰值调频。
通过汪玉教授的深入分析和丰富实践案例，我们可以看到，在生成式AI时代，提升能效不仅是技术挑战，也是推动产业进步和实现可持续发展的关键。