
对于任何数据中心而言,环境监测与管理都是至关重要的任务之一。高温和高湿环境可能会损坏IT设备,进而引发故障。此外,此类环境也会给在数据中心内部工作的员工带来不适。
幸运的是,许多系统和技术能够协助监控并管理数据中心的制冷工作,从而维持最佳的温度和湿度水平。
什么是数据中心制冷?
数据中心消耗大量电力,而电力消耗会产生热量。设施内设备越多,产生的热量也就越多。数据中心制冷是指用于维持数据中心内部理想温度和湿度水平的各类工具、系统、技术及流程。
恰当的数据中心制冷方案能够确保整个设施拥有充足的通风、湿度控制及降温能力,从而使所有设备的运行温度均保持在预期的范围内。
为何数据中心制冷至关重要?
高温和高湿环境对于IT及电气设备而言是极不理想的运行条件。大多数IT设备在运行过程中都会产生热量,因此必须迅速将这些热量散发出去,以避免设备性能因过热而发生衰退。
设施和设备布局的设计应旨在最大限度地减少多余的热量和湿度,因为这些环境条件可能会损坏设备,导致其发生故障甚至彻底停机。更糟糕的是,受损的设备会增加设施的火灾风险,并给现场工作人员带来其他安全隐患。这些风险会推高运营成本,因为设备需要更频繁地进行维修或更换。
鉴于大多数数据中心运行的是 ASHRAE A1 和 A2 级设备,设施管理者必须确保其冷却系统能够胜任相应的任务。为了满足冷却需求而不得不采购额外设备或更新换代设备,正是全球冷却市场持续增长的主要驱动力;据 Astute Analytica 预测,直至 2033 年,该市场将保持近 14% 的年均增长率。
据 Research and Markets 预测,仅美国冷却市场的支出规模到 2029 年就有望达到 82.4 亿美元。
数据中心的冷却机制是如何运作的?
数据中心的冷却过程旨在将设备及周围空气产生的热量带走,并代之以温度较低的冷空气。这一过程通常通过以下几种方式来实现:
- 气流管理策略:旨在最大限度地排出热空气并促进冷空气循环,例如“冷热通道”设计、高架地板送风系统,以及利用气压差来调节温度的绝热冷却技术(如自然冷却/Free Cooling)。
- 设备直接冷却方案:旨在直接针对发热组件进行冷却,例如芯片级液冷(Direct-to-chip)、浸没式冷却、后门式热交换器以及微通道热交换器。
- 设施环境冷却/加热策略:将设施环境温度维持在建议的最高限值,并在设备发生故障时予以更换。采用这种环境冷却(或称“紧耦合冷却”)的方法在经济上可能更具优势,因为其成本往往远低于频繁更换设备的费用。
当前的数据中心冷却系统与技术
风冷和液冷是目前数据中心领域最主流的两种冷却方式,每种方式又包含多种具体的技术路径。
风冷技术
自数据中心诞生之初起,风冷技术便一直是该领域的标准配置。这是一项技术成熟且应用策略清晰的技术;若将其与高架地板、冷热通道设计等辅助手段相结合,足以满足小型数据中心或处理常规工作负载的设施的冷却需求。在采用架空地板的机房布局中,当机房专用空调(CRAC)或机房空气处理机(CRAH)输送冷风时,架空地板下方的气压会随之升高,从而将冷风压入设备的进风口。冷风将热风挤出,热风随后被回送至 CRAC 或 CRAH 设备中,经过冷却处理后再重新循环输送。
列间制冷单元提供了一种更为精准的制冷方案,通过将其部署在更靠近热源的位置,从而提高了制冷效率,并缩短了对各类告警或监控系统变化做出响应所需的时间。
CRAH 的能效通常高于 CRAC,因为它引入的是室外空气,并利用冷冻水而非制冷剂来对空气进行冷却。相比之下,CRAC 的工作原理类似于家用空调,依靠制冷剂来降低空气温度。鉴于 CRAC 难以满足企业级数据中心对制冷能力的高强度需求,它通常更适用于规模较小的机房或数据中心机柜室。
冷热通道布局
在这种基于气流的冷却策略中,服务器机柜和机架呈行状排列,且相邻两行的朝向彼此相反。通过实现进气口和排气口更具针对性的布局,冷热空气通道设计显著提升了冷却系统的运行效率。热空气经由热通道排出,冷空气则通过冷通道输送。这种设计有效防止了冷热空气的混合,从而使冷却系统能够更高效地运作。
您可以在布局中增设门、墙体或隔板,以进一步引导冷热通道内的气流走向。此外,应尽可能填满机柜空间,避免因存在空隙、缝隙或线缆开口而导致冷热空气泄漏至对向通道,进而迫使冷却系统超负荷运转。
液体冷却
随着服务器工作负载和密度(尤其是涉及 AI 工作负载时)的不断增加,液体冷却方案也在持续演进。相比空气冷却,液体冷却效率更高,因为它能更有效地将设备中最发热组件产生的热量传导出去。液体冷却更具成本效益,因为它可直接安装在那些最需要散热的设备上。此外,它还能支持更高的设备密度,并适用于那些发热量高于平均水平的设备——例如高密度数据中心和边缘计算数据中心中的设备。
液体冷却主要分为两大类:
1.直接芯片冷却(Direct-to-chip liquid cooling)。该方法利用柔性管道将不可燃的介电流体直接输送至发热量最大的处理芯片或主板组件(如 CPU 或 GPU)上。流体通过汽化作用吸收热量,随后以蒸汽的形式通过同一管道将热量带出设备。
2.浸没式冷却(Liquid immersion cooling)。该方法将整个电子设备浸泡在一个封闭系统内的介电流体中。流体吸收设备散发的热量并将其汽化,随后再将蒸汽冷凝,从而帮助设备实现降温。
另一种辅助冷却方法是后门热交换器(RDHx)。该方法通常与液体冷却配合使用,即在服务器机柜的后部加装一扇特制的门,用于冷却服务器排出的热空气。与此同时,冷却液会将吸收的热量输送至二级冷却系统进行处理。后门热交换器可分为被动式(Passive RDHx)和主动式(Active RDHx):前者依靠服务器内部风扇产生的气流进行热交换;后者则在机柜上额外加装风扇,辅助将排气从机柜中抽出并送入二级冷却系统。
二级冷却系统设备
除了主要的冷却系统和方案之外,若要确保冷却系统具备高可靠性和高效率,还需要配备其他辅助系统和设备,具体包括:
- 传感器。用于监测温度、湿度和气流等参数。
- 监控应用程序。即各类预警软件或模块,能够在潜在故障发生之前,向数据中心运维人员提供实时反馈。
- 管道系统及其他物理设备。维护得当的管道、排热/进气口、软管、高架地板以及服务器机柜,对于维护冷却系统的完整性、运行效率及正常运行时间(Uptime)均至关重要。
数据中心冷却中的能效重要性
冷却系统应当作为数据中心整体能效策略的一个有机组成部分。据麻省理工学院斯隆管理学院(MIT Sloan School of Management)预测,随着超大规模及人工智能驱动型工作负载的不断增加,数据中心设施将面临日益高昂的能源账单;到2030年,其能源消耗将占全球能源需求的近21%。
确保设施的基础设施(例如暖通空调和电力系统)处于良好的维护状态,是迈出的良好第一步。接下来,运营人员可以对其所使用的IT硬件进行检查,以确保其始终保持最佳运行状态。适时实施设备更新与淘汰流程,有助于引入更为现代化、高效的技术。
探索新型冷却技术,是提升能源效率的另一种途径。诸如自然冷却(Free Cooling)和液体冷却系统等新型及进阶技术,能够显著降低冷却需求,并全面提升设施的能源利用效率。
未来的数据中心冷却系统与技术
尽管液冷技术目前仍相对较新,但其他数据中心冷却技术也已初露端倪,例如地热冷却法、利用人工智能(AI)和机器学习来优化冷却监控与管理的智能技术,以及蒸发冷却技术。
致力于实现碳中和的数据中心冷却
以下是数据中心利用自然资源为其设施降温的一些途径:
• 地热冷却利用地壳近乎恒定的温度来提供冷源。这一理念源远流长(已有数百年历史),最初曾被用于冷藏食物,如今已被改良并应用于现代社会。在数据中心场景中,地热冷却系统采用闭环管道设计;管道内循环流动的水或其他冷却液,会穿行于充满导热流体的地下垂直深井之中。Iron Mountain 位于宾夕法尼亚州西部的数据中心、冰岛的 Verne Global 以及挪威的 Green Mountain 均采用了地热冷却技术。
• 蒸发冷却(亦称“湿帘冷却”或“沼泽冷却”)利用了水在接触流动空气时因蒸发汽化(由液态转为气态)而引发的降温效应。系统通过风扇将数据中心内的热空气吸入,使其流经一块浸润了水或冷却液的湿垫;随着液体蒸发,空气温度随之降低,随后被重新送回数据中心。相比传统的风冷式暖通空调(HVAC)系统,蒸发冷却系统的运行成本仅为其一小部分,且在低湿度气候环境下能发挥出最佳的降温效果。
• 太阳能冷却技术能够将太阳热能转化为冷能,并将其应用于数据中心的气冷系统中。该系统通过收集太阳能,利用热驱动冷却原理来降低建筑内部的空气温度。这项技术特别适用于日照充足的地区,或是那些希望引入更环保的辅助手段来强化现有冷却能力的数据中心。
• Kyoto Cooling(京都冷却系统)是对“自然冷却”(Free Cooling)方法的一种改良与升华;它利用一种“热轮”(Thermal Wheel)装置来调节数据中心内冷、热区域之间的气流交换。随着热轮的旋转,数据中心内部的热空气会被排出至室外;随后,室外的新鲜空气流经热轮,在为其降温的同时,也冷却了即将被吸回设施内部的空气。相比其他类型的机房空调(CRAH)系统,Kyoto Cooling 系统的运行能耗可降低 75% 至 92%,不仅有助于减少二氧化碳排放,还能彻底免除冷却系统中对水资源的需求。目前,联合航空(United Airlines)位于芝加哥郊区的数据中心以及惠普(HP)位于多伦多郊区的数据中心均采用了这项技术。
让数据中心制冷更加智能化
鉴于许多新型的数据中心制冷技术往往要求设施业主投入巨资,智能化技术因此应运而生并日益普及。数据中心智能助手、人工智能(AI)以及机器学习技术,能够更高效地对设施进行监控,并做出实时调节,从而确保温度和湿度始终维持在最佳水平。以谷歌(Google)为例,该公司便利用智能温控系统来降低热量排放及制冷能耗。
数据中心制冷机器人能够在设施内部自由移动,对特定服务器机柜内的温度和湿度进行监测。在人工监测机柜温度时,往往会面临一个难题:一旦机柜被打开,其内部的环境状况便会随之发生改变。针对这一问题,OneNeck IT Solutions 等公司开发出了一种机器人传感器探头,该探头可适配于各类标准机柜。这款机器人通过机柜内部的皮带传动导轨上下移动,逐层采集每个机架的温度数据。随后,它利用蓝牙技术将数据传输至已连接的终端设备,从而协助数据中心专业人员绘制出该机柜完整的“热力图”。
热交换技术的改进
大多数技术系统都包含热交换功能;随着数据中心需要处理日益繁重的计算工作负载,这项技术也在不断演进。服务器微通道热交换器正朝着采用更大通道和不同流体的方向发展,从而实现更高效的热传递。此外,相比传统的热交换方案,这些新型设备所需的制冷剂更少,从而提升了整体性能。
数据中心的需求只会持续增长,因此设施业主及其客户必须寻求更高效、更具成本效益的制冷解决方案——无论是选择对环境影响较小的方案(如地热制冷和自然冷却),还是投资并整合各类新兴技术(如针对高功率服务器的浸没式液冷技术)。
作者:Julia Borgini






参与评论 (0)