世界环境日|如何驯服AI大模型这匹“能耗巨兽”?
世界环境日|如何驯服AI大模型这匹“能耗巨兽”?

自从ChatGPT惊艳全球,世界范围内开始掀起AI大模型开发热潮。但人们正在逐渐发现,无论训练还是应用,大模型都电耗极高,不仅成本高企,对环境也带来了巨大压力。如今,双碳发展已是全球共识,为大模型节能降碳刻不容缓。
根据斯坦福大学人工智能技术研究室(HAI)近日公布的《2023年人工智能指数报告》,GPT-3是当前大模型中有据可依的第一大“电老虎”,光是训练GPT-3,就消耗了128.7万千瓦时电量,产生了550吨碳排放,相当于数百辆汽车一整年的排放量。如今ChatGPT热度居高不下,根据OpenAI官方博客,ChatGPT在今年1月份共处理了约30亿次查询,参考BLOOM(与ChatGPT底层语言模型大小相似)模型执行推理的能耗,每次查询耗电0.00396千瓦时,这意味着ChatGPT一个月就消耗了约1188万千瓦时的电力,堪比一座小城镇。
怪不得曾经有戏言称,马斯克为了节约制冷和耗能,计划用SpaceX把超级计算机搬上太空。随着时代发展对算力的要求越来越高,数据中心节能降耗刻不容缓。近日,财政部、生态环境部、工业和信息化部联合印发关于《绿色数据中心政府采购需求标准(试行)》的通知,明确要求今年6月起数据中心PUE(电能比)不高于1.4,2025年起数据中心PUE不高于1.3,绿色低碳是数据中心发展的必然方向。
联想温水水冷技术
AI大模型节能降耗“神助攻”
数据中心的能耗结构中,制冷系统的能耗仅次于信息设备能耗,因此降低数据中心的制冷能耗,是降低PUE的关键。随着AI、云计算等技术升级,数据中心功率密度逐渐提升,规模化趋势明显,传统风冷技术已无法满足其散热需求,而液冷技术由于散热介质比热容更大,制冷量大,制冷效率高,成为提升数据中心效能的重要条件。据统计,液冷技术最高可降低数据中心近90%的散热能耗,液冷已经为近年来发展最快的数据中心节能制冷技术。
在数据中心行业深耕多年的联想集团,早在二十多年前便发布了温水水冷技术, 2011年部署了世界第一台大规模温水水冷系统高性能计算机,如今相关产品已经迭代到了第五代,在全球部署超6万台。温水水冷技术是指通过去离子水对数据中心服务器进行散热的液冷解决方案,是材料学、微生物学、流体力学、传热学等学科的技术结晶。联想温水水冷技术在节能降耗、性能提升、安装运维方面均有出色表现。
01 助力节能降耗,数据中心PUE降至1.1
出色水回路
联想温水水冷技术的重要优势在于出色的水回路设计,利用去离子水作为导热介质,对CPU、GPU等采用微通道(通道当量直径在10~1000μm)散热器;针对内存、较低功耗的I/O板卡等部件采用导热板散热技术,能够实现高达50度的进水温度,并达成更高的能源再利用率,将热移除效率整体提升至近100%,数据中心PUE可达1.1。
可适应水温2-50度
联想温水水冷系统,去离子水在2-50度温度范围内皆可运行,对散热介质温度与机房环境温度要求很低,降低散热介质温度控制成本进一步节约能耗。
支持热能回收
联想温水水冷系统可支持热能回收进行楼宇供暖等,不同于业内常见的水温保持在40~45摄氏度,联想通过大量实验数据分析认为,进水的温度最高50度,出水温度58度左右,可以获得最佳的能耗比和经济效用。一方面室外侧散热效率更高,甚至可实现自然冷却;另一方面可直接满足城市地暖、热水供应对水温的要求,利于数据中心余热利用。
标准化单元交付,减少包装浪费
联想温水水冷计算产品统一在工厂进行机柜整装,成系统、标准化交付,免除服务器等产品的分散包装,进一步降低客户间接能耗与碳排放。
02 数据中心高性能稳定运行,Linpack效率近90%
并行水回路设计,防止系统抖动
联想温水水冷系统对服务器主要部件并行的水回路设计,即服务器中的两颗CPU由并行的两个水回路散热,两颗CPU温度保持一致,进而保证性能一致,通过提升频率来提升性能,在确保温度均匀性的同时防止热抖动,从而保证CPU具有稳定的性能表现。据测试,联想为吉利部署的高性能计算中心,Linpack效率可近90%。
高散热率下的高计算密度
与风冷系统相比,联想温水水冷系统最高可达98%的热移除效率,与极致的内部空间利用率,让数据中心在有限的空间内可以容纳更多服务器节点,例如一个标准的42U企业级机柜,联想温水水冷系统可实现安装72个计算节点。更高的计算密度,对于高性能计算这种动辄上千个节点的集群来说,可以大大节省空间。
无风扇设计,散热系统机械故障率接近于0
传统风冷散热模块的主要由风扇组成,由于高性能计算中心运算量大、运算时间长,非常依赖计算单元的稳定运行。但传统散热机械机构,长时间在高温度的环境下运行,容易损坏,进而影响服务器的计算效率甚至导致宕机。联想温水水冷服务器,取消了散热模块机械结构,使用了更加稳定的水回路结构,极大降低了散热模块的故障率。
03 标准交付与安装,极大降低安装运维成本
标准化交付与安装
联想温水水冷系统计算产品统一在工厂进行标准化机柜预装(LESI),现场只需简单安装与部署,客户几乎可做到开箱即用,且标准化服务器机柜单元,后期运维简单明了,方便快捷。
支持热插拔0滴漏
联想温水水冷系统支持热插拔,0滴漏,符合数据中心传统运维、检修习惯。
散热介质为温水,成本低
相较于浸没式液冷技术,联想温水水冷技术的导热介质为去离子水,材料成本极低且绿色安全无毒。
更高兼容性提高利旧率
与标准机架和服务器兼容,对传统数据中心的改造成本更低,提高利旧率。
通过联想温水水冷技术的应用,可减少对精密空调和系统风扇的需求,为数据中心节约42%的能耗和间接碳排放,也就是说,如果ChatGPT大模型采用了联想温水水冷技术,每月最高可省电近500万度,大约是10,000个家庭的月度电耗。而且与普通的风冷系统PUE2.0相比,联想PUE(数据中心总能耗/IT设备能耗)可以做到1.2甚至1.1以内,即1度电用于计算,只要0.1度电或者是0.2度电用于散热,能源再利用效率ERE更是达到了业界领先。联想温水水冷技术融合科学计算和智能计算,打造覆盖全行业的绿色低碳的智能基础设施解决方案,目前已在多个高性能计算中心得到应用。
联想助力绿色冬奥
高性能计算系统年用电减少近200万度
在北京冬奥会上,联想为北京气象局搭建了绿色高性能计算系统,让这次冰雪盛会可以做到每隔10分钟更新一次气象状况,甚至可做到每分钟更新。正是气象高性能计算的“黑科技”支撑,北京奥运会创造了冬奥会赛事服务史上的最高标准。通过“温水水冷”技术的运用,系统核心算力提升近20倍,满足了7×24小时无休的天气、气候及环境气象业务应用需求,为复杂的山地百米级、分钟级预报提供了算力保障,解决了这个国际公认的难题。同时达到年用电减少近200万度,相当于节省了北京6000户家庭一个月的用电量和100多万棵树的碳排放量。
上海交通大学“思源一号”
高性能计算集群 实现42%节能减排
以采用温水水冷技术打造的上海交通大学“思源一号”绿色水冷高性能计算集群为例,“思源一号”总计算力为6千万亿次/秒(双精度),在中国高校高性能计算排名第一,算力超过哈佛、剑桥等国际名校。“思源一号”具备超高计算密度与功耗密度、绿色节能、能源可循环利用三大技术特色:在计算密度方面,“思源一号”计算密度是通用数据中心的5倍,需要的机房面积不足通用机房的1/10;在绿色节能方面,“思源一号”采用第五代温水水冷技术,PUE降低至1.1左右,实现42%的节能减排;在能源利用方面,用余热回收技术,计算机运算过程中产生的余热,能够用于研究所球形大厅的冬季供暖、食堂厨房的热水加热、地下室除湿,以及实验室的空调温控,实现每年950吨的额外碳补偿。
吉利汽车高性能计算集群:
中国制造行业首个水冷仿真集群
Linpack效率近90%
汽车仿真计算是高性能计算机的一个重要应用场景,在联想为吉利汽车打造的高性能计算集群中,全面采用联想第五代温水水冷技术,理论峰值可达3.536PFlops,Linpack效率高达近90%,为吉利汽车的汽车设计、生产与测试等提供了强劲的算力保障。同时,此项目还开创了高性能计算与xCloud云计算相结合的先例,让高性能算力更灵活的助力业务实际应用。基于共同的低碳理念与先进技术,联想与吉利将持续深化合作,共同打造绿色低碳在制造行业的最佳实践。
目前,联想温水水冷技术已连续多年入选工业和信息化部编制的《国家绿色数据中心先进适用技术产品名录》,并被选入国家互联网信息办公室主办的首部《携手构建网络空间命运共同体实践案例集》。联想温水水冷技术已成为我国推广高效节能技术的卓越实践与行业标杆。
凭借业内领先的低碳节能技术与业务布局,联想已经成为高性能计算产业绿色发展的领导者。未来,联想也将持续以绿色算力释放行业新动能,助力百业千行绿色低碳转型,赋能数字经济高质量发展。