数据中心巷位于华盛顿特区外,占地 30 平方英里,拥有 200 多个数据中心,其耗电量与波士顿大致相同。因此,去年夏天的一天,当其中很大一部分数据中心(共 60 个)突然断电并转而使用现场发电机时,电力公司官员感到震惊。
此次大规模反应是由数据中心行业标准安全机制引发的,该机制旨在保护计算机芯片和电子设备免受电压波动造成的损害。但联邦监管机构和公用事业高管表示,该机制导致电力过剩现象大幅增加。
这种不平衡程度迫使电网运营商 PJM 和当地公用事业公司 Dominion Energy (DN),减少发电厂的发电量,以保护电网基础设施,并避免出现整个地区发生连锁停电的最坏情况。
此次险些发生的事故——本文首次详细报道——迫使联邦监管机构认识到美国电网的一个新弱点:数据中心未经通知就断电。
“随着这些数据中心规模越来越大,消耗的能源也越来越多,电网的设计无法承受 1,500 兆瓦数据中心的损失,”NERC 可靠性评估和系统分析主管 John Moura 在接受路透社采访时表示。“除非增加更多的电网资源,否则在某种程度上,数据中心规模太大,无法承受。”
从历史上看,电网运营商已经为大型发电厂脱机做好了计划。但随着数据中心的迅速扩张,处理用于人工智能和加密挖掘的大量信息,电网运营商不得不为新的突发事件做好计划,并使平衡国家电力供需这一本已十分困难的任务变得更加复杂。
美国联邦能源管理委员会前主席高级顾问艾莉森西尔弗斯坦 (Alison Silverstein) 表示:“这告诉我们,数据中心的行为有可能导致整个地区的连锁停电。”
该事件于 7 月 10 日发生在弗吉尼亚州费尔法克斯市华盛顿特区郊区附近,该地区因集中了为微软、谷歌和亚马逊提供服务的设施而被称为数据中心巷。全球约 70% 的互联网流量流经该地区。
事件发生一个月后,负责电网可靠性的联邦监管机构北美电力可靠性公司(NERC)成立了一个工作组,研究数据中心和加密矿工的大规模断电事件。
为了撰写本文,路透社查阅了数千页的监管文件,采访了十几位行业高管,以确定故障的根源——弗吉尼亚州费尔法克斯附近 Dominion 公司 Ox-Possum 230 千伏线路上的电涌保护器故障——以及故障对该地区的蔓延。
NERC 在一月份的一份报告中审查了这一事件,但并未透露故障的具体位置、涉及的数据中心数量,也未透露 PJM 和 Dominion 如何平衡电网的电力供需。
险情事件增多
过去五年来,随着越来越多的数据中心投入使用,类似数据中心巷事故的发生数量迅速增加。
根据劳伦斯伯克利国家实验室 12 月份为美国能源部发布的报告,数据中心使用的电量在过去十年中增加了两倍,到 2028 年可能再次增加两倍。
路透社审查了德克萨斯州主要电网运营商德克萨斯州电力可靠性委员会 (ERCOT) 的披露文件,发现自 2020 年以来发生了 30 多起险情事件,这些事件是由数据中心和加密矿工等大型能源用户离线引发的。
2022 年 12 月,德克萨斯州西部一座变电站的变压器故障,导致近 400 台加密矿工、数据中心以及石油和天然气生产设施在没有任何警告的情况下断电。
电力可靠性委员会 (ERCOT) 表示,大量电力外流导致电力供应过剩近 1,700 兆瓦,相当于电网总需求的 5% 左右,并迫使 112 兆瓦发电厂关闭。
NERC 在 12 月份的一份报告中预测,随着新数据中心的投入使用,停电风险只会增加。报告称,未来 5 到 10 年,几乎整个美国都将面临更高的能源短缺风险。
监管机构敦促公用事业公司考虑更新数据中心和加密矿工的联邦可靠性标准。
有争议的解决办法
NERC 表示,许多数据中心都由运营商设计,在电网出现问题时立即切换到本地发电机,以最大限度地降低谷歌搜索或加密挖掘等服务中断的风险。
一些电网运营商提议要求数据中心在不切断电源的情况下“渡过”常规电压骤降。但数据中心运营商反对,因为这可能会损坏电子设备和冷却系统。
由于面临行业组织数据中心联盟的反对,ERCOT 去年撤回了一项对数据中心和加密矿工实施穿越限制的提案。
该组织的成员包括亚马逊、谷歌和 Meta,他们指出,这样做存在成本问题,而且电脑芯片和冷却系统暴露在波动的电压水平下存在损坏的风险。
该联盟在 2024 年 1 月向 ERCOT 提交的评论中表示:“数据中心硬件和电源与其他电子设备类似,对电源稳定性非常敏感。”
“偏离这个范围将会降低最佳性能,缩短使用寿命,或损坏无法修复的组件。”
该联盟在给路透社的一份声明中表示,它打算成为电网运营商的有益合作伙伴。
该联盟能源副总裁 Aaron Tinjum 表示:“我们完全认识到电网规划和管理是公用事业和电网运营商的责任,但 DCC 致力于作为积极参与的合作伙伴提供帮助,并确保我们共同迎接这一时刻。”
亚马逊、谷歌和 Meta 均未回复置评请求。ERCOT 亦未回复置评请求。
ERCOT 运营工程师 Patrick Gravois 在 12 月向 NERC 大型负荷工作组的报告中表示,随着更大规模的运营接入德克萨斯州电网,这些断电事件的严重程度“很有可能”加剧。
格拉沃斯表示,电网运营商仍在努力查明究竟是什么原因导致电力大用户切断电网连接,以避免出现意外。
哈佛法学院电力法计划主任阿里·佩斯科 (Ari Peskoe) 表示,监管机构可能会要求数据中心应对电压骤降 - 但这可能会使大型科技公司迁往规则更为宽松的州。
施耐德电气安全电源部门首席技术官吉姆·西蒙内利 (Jim Simonelli) 表示,从今年 7 月华盛顿特区郊外发生的事件中,公用事业和数据中心行业可以吸取很多教训。
西蒙内利说:“数据中心行业目前尚不存在的一件事就是如何实现电网友好型。”