每个关于高密度数据中心的讨论最终都会遇到同一个瓶颈:热量。传统空气冷却已经不够用了。这时,用于液体冷却系统的CDU(冷却液分配单元)就派上了用场。但这些设备究竟有什么作用?为什么它们突然在人工智能和高性能计算设施中无处不在?
让我来分析一下冷却液分配单元(CDU)在现代液冷数据中心中发挥的五大核心作用--摒弃市场营销的花哨。.
CDU 如何保护 IT 硬件免受设施进水的影响
在早期的液体冷却实验中,一些工程师曾尝试将设备用水直接注入服务器机架。结果并不理想。设备冷却回路通常会携带污染物、微粒、结垢剂和不一致的水化学成分,这些都会对脆弱的冷板和微通道造成严重破坏。.
CDU 可将设备水系统 (FWS) 与技术冷却系统 (TCS) 完全隔离。这两个液压回路完全分开,仅通过一个板式热交换器连接,在不混合流体的情况下传递热量。技术冷却系统回路通过服务器冷板直接循环清洁的工程冷却剂(通常是含有腐蚀抑制剂的水-乙二醇混合物)。与此同时,FWS 回路可以输送大楼供应的冷冻水和冷凝水,而不会危及昂贵的 IT 设备。.

一些制造商非常重视这种隔离。例如,三菱电机的 ME-CDU 完全采用 304/316 不锈钢管道构建液压结构,以确保流体的纯净度和长期抗污染能力。.
冷却液分配装置的核心热交换工作
物理原理非常简单。当冷却液在连接 CPU、GPU 和加速器的冷板中循环时,会吸收热能。加热后的液体返回 CDU,在 CDU 中,钎焊板热交换器将热量从 TCS 回路转移到 FWS 回路。然后,设施环路将热量输送到冷却塔、干式冷却器或冷却器,进行最终排出。.
现代人工智能芯片组推动了这种热传递的规模。英伟达™(NVIDIA®)的 Blackwell GPU 的热设计功率(TDP)为 2,000 瓦。一台 GB200 NVL72 机架服务器的八个 GPU 和两个 CPU 的 TDP 总功率可达 10 千瓦。在设备层面,CDU 现在的单机冷却能力从 345 千瓦到 1,380 千瓦不等,其中一些落地式型号专为直接液对芯片冷却和浸入式冷却应用而设计。.
更新的架构正在进一步推动这些能力的发展。在泵送式两相直接芯片冷却系统中,冷却剂实际上是在冷板内部蒸发,单位质量吸收的热量远远超过单相系统。.
液体冷却系统 CDU 为何必须实时调整
这部分没有得到足够的重视。CDU 不仅仅是一个被动的热交换器,它还能主动管理整个二次回路的液压系统。.
集成式泵通常配备变速驱动器和 N+1 或三冗余结构,以精确控制的流量通过 TCS 循环冷却液。电动控制阀根据来自压力传感器、流量计和温度探头的传感器反馈进行实时调节。.
这有什么关系呢?因为热负荷不是一成不变的。人工智能训练工作负载会不断上升和下降。配置良好的 CDU 会自动做出响应,在计算高峰期提高泵速,在空闲期降低泵速,以节省能源,同时保持机架中每个冷板都有足够的冷却范围。.
2025 年,全球 CDU 销量约为 88,000 台,平均市场价格约为每台 $15,000 美元。这些设备并不是闲置在那里,而是在积极思考和调整。.
防止液冷 CDU 循环系统中的降解现象
这一点很微妙,但却至关重要。板式热交换器内部的通道可能非常狭窄,从 2 毫米到 8 毫米不等。即使是微小的颗粒也会造成堵塞,降低热传导效率,最终导致组件过早失效。.
CDU 包括一次侧和二次侧过滤。二次回路(TCS)通常采用更精细的过滤--在许多设计中为 25 微米,以保持冷却剂的纯度。一些先进的设备还能监测水化学参数,如电导率、pH 值和腐蚀抑制剂浓度。.
这样做的目的是使 TCS 冷却剂保持足够的清洁度,以满足微通道冷板和敏感 IT 硬件的要求,同时允许 FWS 循环在纯度要求不那么严格的情况下运行。这种双层方法兼顾了性能需求和操作实用性。.
利用企业 CDU 实现零停机时间
数据中心讨厌停机。液体冷却系统讨厌泵故障。解决方案是什么?冗余一切。.
大多数企业级 CDU 都采用 N+1 或 2N 泵配置。当主泵发生故障时--总有一天会发生故障--备用泵会无缝接管。Subzero Engineering 报告称,现代 CDU 通过三冗余架构和以毫秒为单位的故障切换时间,实现了 99.999% 的系统可用性。.
甚至控制系统也具有容错功能。可编程逻辑控制器 (PLC) 或嵌入式控制模块可管理所有操作,先进的设备支持通过 Modbus RTU、Modbus TCP/IP、BACnet IP、SNMP 和 HTTP 协议进行远程监控,可直接集成到现有的 DCIM 平台中。.
为什么 CDU 在液体冷却中的作用比以往任何时候都重要?
数据中心液体冷却市场达到约 5.52偏颇llio九2025一个disp咆哮j生态tedto嗨t到 2030 年将达到 157.5 亿美元,复合年增长率为 23.31%。CDU 预计将从 720英里llio九2023to到 2030 年将达到 30.8 亿美元,年均复合增长率为 20.5%。.
但更有趣的信号来自芯片设计。据报道,英伟达即将推出的 Vera Rubin 计算托盘设计完全消除了服务器风扇,需要在机架层面采用全液冷配置。据预测,到 2030 年,直接液冷的年产量将超过 1800 亿吨,从可选升级过渡到人工智能工厂的基础架构。.
底线
冷却液分配装置不仅仅是一个安装在热交换器上的泵。它是一个智能控制层,可使数据中心的液体冷却实现规模化。冷却液分配单元提供液压隔离、热传递、动态流量管理、过滤和运行冗余等功能,所有这些功能都集成在一个协调的软件包中。.
如果您正在设计一个新的人工智能集群、改造现有设施,或者只是想了解下一项重大基础设施投资的去向,那么 CDU 应该得到比通常情况下更多的关注。它并不华丽。但它绝对是必不可少的。.
随着每个机柜的机架密度不断超过 100 千瓦,问题将不再是液冷系统是否需要 CDU。而是需要多少。.






















