CDUs para sistemas de refrigeração líquida: 5 trabalhos que seu rack de IA não pode fazer sozinho.

partilhar com:

Toda conversa sobre data centers de alta densidade acaba esbarrando no mesmo gargalo: o calor. O resfriamento por ar tradicional já não é mais suficiente. É aí que entram as CDUs para sistemas de resfriamento líquido. Mas o que exatamente essas unidades fazem e por que de repente estão em toda parte nas instalações de IA e HPC (computação de alto desempenho)?

Deixe-me explicar as cinco funções principais que uma Unidade de Distribuição de Refrigerante (CDU) desempenha num centro de dados moderno arrefecido a líquido - sem as tretas de marketing.

Como as CDUs protegem o hardware de TI da água das instalações

Nos primórdios das experiências de arrefecimento líquido, alguns engenheiros tentaram colocar água das instalações diretamente nos bastidores dos servidores. Não correu bem. Os circuitos de arrefecimento das instalações transportam frequentemente contaminantes, partículas, agentes de incrustação e uma química inconsistente da água que pode causar estragos em placas frias e microcanais delicados.

Uma CDU isola completamente o sistema de água da instalação (FWS) do sistema de arrefecimento tecnológico (TCS). Estes dois circuitos hidráulicos permanecem completamente separados, ligados apenas através de um permutador de calor de placas que transfere calor sem misturar fluidos. O circuito do TCS faz circular um líquido de arrefecimento limpo e concebido - frequentemente uma mistura de água e glicol com inibidores de corrosão - diretamente através das placas frias do servidor. Entretanto, o circuito FWS pode transportar tudo o que o edifício fornece, desde água refrigerada a água do condensador, sem colocar em risco o seu dispendioso equipamento de TI.

CDUs para sistemas de refrigeração líquida

Alguns fabricantes levam este isolamento a sério. A ME-CDU da Mitsubishi Electric, por exemplo, constrói a sua estrutura hidráulica inteiramente com tubagem de aço inoxidável 304/316 para garantir a pureza do fluido e a resistência a longo prazo aos contaminantes.

O trabalho de troca de calor do núcleo de uma unidade de distribuição de refrigerante

A física aqui é bastante simples. À medida que o líquido de refrigeração circula pelas placas frias ligadas às CPUs, GPUs e aceleradores, ele absorve energia térmica. Esse fluido aquecido regressa à CDU, onde um permutador de calor de placas soldadas transfere o calor do circuito TCS para o circuito FWS. O circuito da instalação transporta então esse calor para torres de arrefecimento, refrigeradores secos ou chillers para rejeição final.

Os modernos chipsets de IA impulsionam a escala desta transferência de calor. A GPU Blackwell da NVIDIA tem uma potência de design térmico (TDP) de 2.000 watts. Um único servidor de rack GB200 NVL72 pode atingir 10kW TDP para suas oito GPUs e duas CPUs combinadas. Ao nível das instalações, as CDUs têm agora capacidades de arrefecimento que variam entre 345 kW e 1.380 kW por unidade, com alguns modelos de chão concebidos especificamente para aplicações de arrefecimento direto de líquido para chip e arrefecimento por imersão.

As arquitecturas mais recentes estão a levar estas capacidades mais longe. No arrefecimento bifásico bombeado direto para o chip, o líquido de arrefecimento evapora-se efetivamente no interior da placa fria, absorvendo significativamente mais calor por unidade de massa do que os sistemas monofásicos alguma vez conseguiriam.

Por que as CDUs para sistemas de refrigeração líquida devem se adaptar em tempo real

Esta é a parte que não recebe atenção suficiente. Uma CDU não é apenas um permutador de calor passivo - gere ativamente o sistema hidráulico de todo o circuito secundário.

As bombas integradas - normalmente equipadas com accionamentos de velocidade variável e arquitetura N+1 ou triplamente redundante - circulam o líquido de refrigeração através do TCS a taxas de fluxo controladas com precisão. As válvulas de controlo motorizadas ajustam-se em tempo real com base no feedback do sensor dos transdutores de pressão, medidores de fluxo e sondas de temperatura.

Porque é que isto é importante? Porque as cargas térmicas não são estáticas. As cargas de trabalho de treinamento de IA aumentam e diminuem constantemente. Uma CDU bem configurada responde automaticamente, aumentando as velocidades das bombas durante o pico de computação e reduzindo-as durante os períodos de inatividade para economizar energia, mantendo a cobertura de resfriamento adequada em todas as placas frias do rack.

Para se ter uma ideia, as vendas globais de CDUs atingiram aproximadamente 88.000 unidades em 2025, com um preço médio de mercado de cerca de US$15.000 por unidade. Estas unidades não estão simplesmente paradas - estão a pensar e a adaptar-se ativamente.

Prevenção da degradação em circuitos de CDU arrefecidos por líquido

Este é subtil mas crítico. Os canais no interior dos permutadores de calor de placas podem ser incrivelmente estreitos - entre 2 e 8 milímetros. Mesmo pequenas partículas podem causar incrustações, reduzir a eficiência da transferência térmica e, eventualmente, levar à falha prematura do componente.

As CDUs incluem filtragem nos lados primário e secundário. O circuito secundário (TCS) normalmente utiliza uma filtragem muito mais fina - 25 mícrones em muitos modelos - para manter a pureza do refrigerante. Algumas unidades avançadas também monitorizam os parâmetros químicos da água, como a condutividade, os níveis de pH e as concentrações de inibidores de corrosão.

O objetivo é manter o líquido de refrigeração TCS suficientemente limpo para placas frias de microcanais e hardware TI sensível, permitindo ao mesmo tempo que o circuito FWS funcione com requisitos de pureza menos rigorosos. Esta abordagem de dois níveis equilibra as necessidades de desempenho com a praticidade operacional.

Conseguir tempo de inatividade zero com CDUs empresariais

Os centros de dados odeiam o tempo de inatividade. Os sistemas de refrigeração líquida detestam falhas nas bombas. A solução? Tudo redundante.

A maioria das CDUs de nível empresarial implementa configurações de bomba N+1 ou 2N. Quando uma bomba primária falha - e em algum momento, uma irá falhar - a bomba de reserva assume o controlo sem problemas. A Subzero Engineering informa que as CDUs modernas atingem uma disponibilidade de sistema de 99,999% com uma arquitetura triplamente redundante e tempos de ativação pós-falha medidos em milissegundos.

Até os sistemas de controlo são tolerantes a falhas. Os controladores lógicos programáveis (PLC) ou os módulos de controlo incorporados gerem todas as operações, e as unidades avançadas suportam a monitorização remota através dos protocolos Modbus RTU, Modbus TCP/IP, BACnet IP, SNMP e HTTP, integrando-se diretamente nas plataformas DCIM existentes.

Por que o papel das CDUs no resfriamento de líquidos é mais importante do que nunca

O mercado de refrigeração líquida para centros de dados atingiu cerca de 5.52billionin2025andisprojectedtohit5.52billionin2025umdisprojcetedtooit15,75 mil milhões até 2030, o que representa uma taxa de crescimento anual composta de 23,31%. Prevê-se que as CDU, especificamente, cresçam de 720millionin2023to720millionin2023to3,08 mil milhões até 2030, com uma taxa de crescimento anual de 20,5%.

Mas o sinal mais interessante vem do design do chip. Os próximos designs de bandeja de computação Vera Rubin da NVIDIA supostamente eliminam totalmente as ventoinhas do servidor, exigindo configurações totalmente refrigeradas a líquido no nível do rack. Prevê-se que o arrefecimento líquido direto ultrapasse os $8 mil milhões por ano até 2030, passando de uma atualização opcional para uma infraestrutura fundamental para as fábricas de IA.

A linha de fundo

Uma Unidade de Distribuição de Refrigerante não é apenas uma bomba aparafusada a um permutador de calor. É a camada de controlo inteligente que torna o arrefecimento líquido do centro de dados viável à escala. As CDUs fornecem isolamento hidráulico, transferência térmica, gerenciamento de fluxo dinâmico, filtragem e redundância operacional - tudo em um pacote coordenado.

Se estiver a conceber um novo cluster de IA, a reequipar uma instalação existente ou apenas a tentar perceber para onde deve ir o seu próximo grande investimento em infra-estruturas, a CDU merece muito mais atenção do que normalmente recebe. Não é vistoso. Mas é absolutamente essencial.

E como as densidades de rack continuam a subir para além dos 100 kW por armário, a questão não será se precisa de CDUs para sistemas de refrigeração líquida. Será quantas.

Sobre o autor

Gavin

Gavin

O Gavin é gestor de operações numa empresa especializada em equipamento de apoio a centros de dados. Ele é especialista em fontes de alimentação ininterrupta específicas para centros de dados, ar condicionado de precisão e soluções para centros de dados. Ele pode ajudá-lo a compreender melhor estes produtos e a escolher diferentes soluções.

Posts relacionados