Meta 利用强化学习优化数据中心的可持续性

2,132 0 0

文章摘要

Meta公司在其数据中心采用了强化学习（RL）技术，以优化环境控制策略，减少能源消耗和用水量，应对气候变化挑战。强化学习是机器学习和最优控制领域的一个分支，研究智能代理如何在变化环境中做出决策以获得最大奖励信号。Meta的RL方法已有效优化数据中心冷却系统，该系统消耗大量能源和水，尤其在适应天气变化时表现突出。

自2021年以来，Meta工程师应用RL改善不同天气条件下的冷却气流供应。冷却系统是数据中心第二大资源消耗者，优化这些系统可减少能源使用，对减少水消耗和温室气体排放有深远影响。一个试点地区已将送风机能耗降低20%，用水量降低4%。

Meta数据中心主要使用室外空气和蒸发冷却系统，将温度保持在18°C至30°C，相对湿度保持在13%至80%。这种方法节水节能，但需进一步优化以减少必须调节的空气量，这是强化学习发挥作用的地方。

Meta数据中心使用两层阁楼设计，吸入的空气100%来自室外，由调节阻尼器调节，并在必要时与服务器排气热量混合以平衡温度。空气经过过滤器和雾化室后被冷却加湿，然后通过风扇推入服务器机房。系统还将热空气排出建筑物，保持高效空气循环。水在蒸发冷却和加湿中起关键作用，将空气温度湿度保持在最佳范围。

在优化气流时，需调整三个控制回路（温度、湿度和气流），以确保冷却系统高效运行。RL根据实时数据和环境条件动态调整气流，帮助解决这种复杂性。RL将控制系统建模为一系列连续状态，代理以争取奖励的形式从环境中获取反馈，获取关于节能节水的知识。通过分析数千个传感器收集的数据，RL可以微调气流设定点，实现最佳冷却效率，同时保持在运行参数范围内。

为确保可靠性，Meta工程师使用了基于模拟器的RL方法。这种方法允许工程师在模拟环境中训练RL模型，该环境反映了真实数据中心条件。模拟器使用基于物理的模型预测建筑物系统将如何响应天气、IT负载等变量变化。通过结合历史数据和模拟数据，RL模型可以被训练为能够处理各种条件，确保冷却系统即使在异常情况下也能保持高效。这种离线方法降低了在实时环境中直接部署RL模型的风险。

RL试点项目结果令人鼓舞。通过控制送风流量设定点，工程师们设法保持稳定温度条件，同时减少冷却所需空气量。这意味着送风机可显著节省能源，并减少蒸发冷却期间的用水量。Meta正在应用相同的RL方法优化其新数据中心设计，这些数据中心专为支持人工智能负载而建。通过将RL集成到设计阶段，Meta希望确保这些新数据中心从一开始就具有可持续性。此外，他们正在现有数据中心推广这种强化学习方法，以在未来几年内最大限度地节省能源和水资源。

谷歌和微软也在使用人工智能改进他们的数据中心。DeepMind为谷歌数据中心节省了40%的冷却能源。微软推出了人工智能驱动的异常检测方法来监控和解决其数据中心内电力和水使用的异常情况。这些方法利用了来自电气和机械设备的遥测数据。此外，微软采用基于人工智能的技术来检测和解决电表问题，并确定最佳服务器位置，减少电力、网络和冷却能力的浪费。

总之，使用强化学习进行数据中心冷却优化是Meta长期可持续发展战略的关键组成部分。通过利用人工智能提高数据中心效率，Meta正在采取有意义措施减少对环境的影响，同时满足数字基础设施日益增长的需求。