• 联系我们

    计算机房冷却装置:您是否犯了这 4 个常见错误?

    分享给

    在每家企业的数字骨干网中--无论是小型办公电脑室还是中型 IT 中心--都有一个 "数字世界"。计算机房冷却装置 是确保运行连续性的无名守护者。服务器、存储设备和网络设备会持续产生热量;一个机架可产生 5-20 千瓦的热能,即使与最佳温度(根据 ASHRAE 指南,18-24°C)稍有偏差,也会导致硬件节流、数据损坏或灾难性停机。.

    服务器停机的平均成本高达每小时 $100,000 美元(Gartner),因此正确设置冷却系统至关重要。然而,许多企业在使用机房冷却装置时都不知不觉地犯了代价高昂的错误--从选择不当到疏于维护--这些错误损害了效率、可靠性和使用寿命。在本篇文章中,我们将介绍最常见的错误以及如何纠正这些错误,确保冷却设备发挥最大价值。.

    计算机房冷却装置

    1.选择计算机房冷却装置的常见错误

    -忽略热负荷计算

    企业所犯的最大错误就是在选择机房冷却设备时跳过热负荷计算。热负荷指的是所有 IT 设备产生的热量总量,再加上日照和隔热等环境因素。如果不进行这种计算,基本上就是凭空猜测,要么导致冷却不足(处理热量的能力不足),要么导致冷却过度(设备过大浪费能源)。.

    冷却不足是一场等待发生的灾难。芝加哥的一家中型营销公司就深有体会:他们为一个拥有 8 个机架(总热负荷为 45 千瓦)的计算机房安装了一个 30 千瓦的冷却装置。没过几个月,机房就出现了热点(温度高达 29°C),导致服务器在高峰时段运行缓慢,并造成两次长达 45 分钟的停机。过度冷却同样存在问题:波士顿的一家会计师事务所选择了一台 60 千瓦的设备,热负荷为 35 千瓦。为了避免过度冷却空间,该设备进行了短周期运行(频繁开启和关闭),导致组件磨损,与适当大小的系统相比,能源费用增加了 38%。.

    解决方法很简单:进行一次彻底的热负荷审计。将所有设备的额定功率相加(可在标签或规格书上找到),再加上 10-20% 的环境因素,然后选择一台制冷量与总功率相匹配的制冷设备(再加上 10% 的缓冲,以备未来增长之用)。ASHRAE 热负荷计算器等工具或向制冷专家咨询都可以简化这一过程。.

    - 选择错误的冷却装置类型

    并非全部 计算机房冷却装置 设计用于相同的环境。选择不适合您的空间、IT 密度或气候的设备会导致效率低下和过早出现故障。最常见的两种类型--风冷精密设备和液体冷却系统--满足不同的需求,但许多企业却将它们混为一谈。.

    风冷式精密设备(最常见的选择)是中低密度机架(≤15 千瓦)和中小型计算机房(50-500 平方英尺)的理想选择。它们具有成本效益,易于安装,并能保持严格的温度控制(±1°C)。然而,奥斯汀的一家云计算初创公司却犯了一个错误,那就是在为人工智能工作负载供电的 4 个高密度机架(每个 20 千瓦)上使用了风冷式设备。这些设备难以处理集中的热量,导致热点不断,能耗增加了 40%。他们本应选择液体冷却系统,因为液体冷却系统的导热效率要高出 4 倍,而且专为超高密度设置(每个机架 15 千瓦以上)而设计。.

    相反,对于小型、低密度机房来说,液冷系统则显得过于昂贵。一家零售连锁店的 3 机架服务器机柜(总负载为 12 千瓦)安装了液冷系统,前期费用是紧凑型风冷设备的 3 倍。该系统需要复杂的维护,浪费了能源,因为它是为更高的热负荷而设计的。主要启示:根据 IT 密度和空间匹配冷却设备类型--中低密度采用风冷式,高密度采用液冷式,临时或边缘设置采用便携式设备。.

    2.影响性能的安装相关错误

    -冷却装置位置不正确

    即使是最好的机房冷却设备,如果摆放不当也会出现故障。常见的摆放错误包括将设备摆放得太靠近墙壁或机架(阻碍气流)、将设备摆放在角落里(形成停滞的热区),或者摆放的方向导致冷空气无法进入服务器进气口。.

    亚特兰大的一家物流公司在机房后墙安装了两台 50 千瓦的精密冷却设备,机房正前方是机架。设备的进气口被机架挡住,使气流减少了 30%,并在机房前部产生了热点。将设备重新放置在侧墙(通往机架的空气通道畅通)后,冷却效率提高了 25%,热点也消失了。另一个常见的错误是将设备放置在热源附近,如窗户(暴露在阳光下)或暖通空调通风口,这会迫使设备更加努力地工作以补偿额外的热量,从而增加能耗和磨损。.

    经验法则是:确保冷却装置的四边至少有 2-3 英尺的间隙,将冷空气导向服务器进气口(与冷通道对齐),并避开热源。对于地板较高的机房,安装设备时应充分利用地板下的空气分配,确保冷空气向上流向机架进气口。.

    - 在安装质量上精益求精

    为了省钱而不进行专业安装是一个代价高昂的错误。不正确的安装会导致制冷剂泄漏、气流不畅、电气问题,甚至水渍(水冷机组)。迈阿密的一家金融服务公司聘请了一家普通的暖通空调承包商(而非计算机房冷却专家)来安装他们的 40 千瓦冷水机组。承包商错误地确定了制冷剂管路的尺寸,导致缓慢泄漏,几个月都未被发现。当问题被发现时,设备的制冷量已经下降了 20%,压缩机也已损坏,维修和停机时间的费用高达 $15,000 美元。.

    专业制冷专家了解计算机房系统的独特要求:适当的制冷剂充注、精确的气流校准以及符合电气和安全标准。他们还会在安装后对系统进行测试,以确保其达到温度和湿度目标。虽然专业安装可能会增加 10-15% 的前期成本,但它可以避免昂贵的维修费用,并确保您的设备从第一天起就以最高效率运行。.

    计算机房冷却装置

    3.缩短使用寿命的维护错误

    -忽视定期清洁/更换过滤器

    空气过滤器堵塞是导致机房制冷设备效率降低的 #1 原因。过滤器会吸附灰尘、花粉和碎屑,但时间一长,过滤器就会堵塞,从而限制气流,迫使设备加大工作强度,增加能耗。西雅图的一家初创科技公司忽视过滤器维护长达 6 个月;当他们检查时,过滤器已经堵塞了 80%,使气流减少了 35%,导致设备全天候运行(而不是根据需要循环开启)。这使他们的制冷能源费用增加了 42%,风扇电机的使用寿命缩短了 3 年。.

    解决方法很简单:每 1-3 个月清洁或更换一次过滤器(在灰尘较多的环境中更换频率更高)。大多数计算机房的制冷设备都有方便使用的过滤器,设置日历提醒来检查过滤器,或者投资购买智能设备,在过滤器脏污时发出警报。对于高灰尘环境(如工业区),可使用高效过滤器(MERV 11 或更高)来捕捉更多颗粒,减少维护频率。.

    -跳过例行检查和校准

    许多企业对待 计算机房冷却装置 在这种情况下,很多人都会把空调设备当作 “设置好就不用管 ”的设备,在出现故障之前都会跳过例行检查。这种做法是错误的--小问题(如传感器故障或制冷剂不足)如果不加以解决,就会升级为重大故障。俄亥俄州一家医院的计算机房有 18 个月没有检查冷却装置。在一次例行检查中,技术人员发现一个温度传感器出现故障,读数不正确(报告温度为 22°C,而实际温度为 26°C)。该设备冷却不足,导致病人数据服务器面临过热风险。.

    例行检查(大多数设备每季度一次)应包括:检查制冷剂水平、测试风扇和压缩机、校准温度/湿度传感器、检查电气连接和清洁盘管。此外,还建议每年进行一次专业维修,以深入清洁部件并找出潜在问题。这些检查的费用为每台设备 $200-$500 美元,但可以避免 $10,000 美元以上的维修费用和停机时间。.

    4.浪费能源的操作错误

    - 温度设置过低(或过高)

    人们普遍误认为服务器机房 “越冷越好”,但将温度设定在 18°C 以下既浪费能源,又不能提供额外保护。波特兰一家软件公司将机房制冷设备的温度设定在 16°C,认为这样可以延长服务器的使用寿命。实际上,这样做增加了 28% 的能耗(因为设备必须更加努力地工作才能维持较低的温度),却没有带来任何可衡量的好处--ASHRAE 证实,服务器在 18-24°C 的温度范围内运行稳定。.

    相反,将温度设置在 24°C 以上则有过热的风险。底特律的一家制造公司为了节能,将设备温度设定在 26°C,结果导致服务器频繁节流,硬件错误增加了 10%。最佳温度为 20-22°C:这兼顾了效率和硬件保护。此外,要避免频繁的手动调节--使用设备的可编程设置来保持温度一致,并利用智能功能(如果有的话)根据实时热负荷进行调节。.

    -忽视湿度控制

    计算机房冷却装置 不仅能制冷,还能调节湿度(最佳范围:40-60%)。然而,许多企业禁用湿度控制或设置不当,导致代价高昂的问题。高湿度(>60%)会导致电路板腐蚀和水凝结,而低湿度(<40%)则会增加静电(可能导致元件短路)。佛罗里达州的一家律师事务所为了节约能源,关闭了冷却装置的除湿器,导致服务器主板的湿度达到 75%,从而造成 3 小时的停机。亚利桑那州一家科技公司忽视了加湿,导致湿度达到 30%,静电引发数据损坏。.

    解决方法:保持湿度控制功能开启并校准到 40-60%。现代计算机房制冷设备具有双级湿度控制(除湿机+加湿器),可自动维持这一范围--不要禁用这一功能。如果您的设备没有湿度控制功能,请购买一台独立的加湿器/除湿机作为补充。.

    计算机房冷却

    如何纠正(和避免)这些错误

    好消息是,大多数错误 计算机房冷却装置 很容易解决:

    • -进行热负荷审计,合理调整设备大小--更换过大/过小的设备,或在需要时增加辅助冷却装置。.
    • -根据需求匹配设备类型: 风冷式适用于中低密度,液体式适用于高密度,便携式适用于边缘设置。.
    • -重新调整设备位置,以获得最佳气流,确保服务器进气口通畅,并避开热源。.
    • -安排专业维护: 每季度检查一次,每月检查一次过滤器,每年维修一次。.
    • -校准设置为 20-22°C 和 40-60% 湿度,避免手动调整。.
    • -投资智能功能:实时监控、预测性维护警报和基于负载的冷却调节。.

    关于作者

    加文

    Gavin 是一家专门从事数据中心配套设备的公司的运营经理。他精通数据中心专用不间断电源、精密空调和数据中心解决方案。他可以帮助您更好地了解这些产品以及如何选择不同的解决方案。.

    相关帖子