¿Qué es un contenedor AIDC? Infraestructura de IA de nueva generación

compartir a:

No se para de oír hablar de las demandas de computación de la IA. Pero el verdadero cuello de botella no es la GPU, sino la infraestructura que la rodea. Los clústeres de entrenamiento de IA requieren densidades de rack muy superiores a las que pueden soportar los centros de datos tradicionales refrigerados por aire, que a menudo oscilan entre 50 kW y más de 150 kW por rack. Aquí es donde entra en juego una nueva clase de infraestructura: Contenedor AIDC (Centro de Datos de Inteligencia Artificial), un centro de datos prefabricado y modular diseñado específicamente para cargas de trabajo de IA.

¿Qué es un contenedor AIDC? Definición y concepto básico

Un Container AIDC no es un centro de datos tradicional. A diferencia de las instalaciones convencionales diseñadas en torno a los principios de “almacenar y poner en marcha”, un centro de datos de IA se construye en torno a los propios datos, centrándose en “utilizar bien y controlar bien” en lugar de simplemente “almacenar y poner en marcha”.”. Piense en ello como un centro logístico inteligente donde cada dato se limpia, etiqueta e indexa en el momento en que llega, listo para su uso inmediato por los modelos de IA..

Alojados en contenedores de transporte ISO estándar, todos los subsistemas funcionales (informática, distribución de energía, refrigeración, redes y gestión) se montan en fábrica, se prueban previamente y se envían como una unidad integrada.. En el momento de la entrega, basta con colocarla sobre una plataforma de hormigón preparada, conectar la alimentación externa y la fibra, y encenderla.

Contenedor AIDC

El modelo de entrega “de la fábrica al campo

Centro de datos tradicionalContenedor AIDC
Construcción secuencial in situFabricación paralela en fábrica y preparación de la obra
De 12 a 24 meses hasta que esté operativoEntre 4 y 6 meses de funcionamiento
Diseñado para 5-15 kW/rack refrigerado por aireDiseñado para 50-150 kW/rack refrigerado por líquido

De los bloques de Lego al centro de datos: Cómo funciona la arquitectura

Un Container AIDC no se construye, se monta. Cada contenedor funciona como un bloque de construcción independiente, prefabricado en fábrica para el transporte estandarizado y la interconexión in situ. La arquitectura sigue un diseño descendente, de sistema de sistemas.

Arquitectura por capas: Del contenedor al clúster

Integración a nivel de contenedor: Cada contenedor ISO de 20 o 40 pies encierra un subconjunto completo y operativo del centro de datos. Los nodos informáticos, el tejido de red de alta velocidad, las unidades de distribución de energía (PDU), los sistemas de alimentación ininterrumpida (SAI), los armarios de baterías, las unidades de distribución de refrigeración (CDU) y los controladores de gestión residen en el mismo recinto sellado y climatizado..

Interconexión entre módulos: Los contenedores no están aislados. Los conductos de alimentación preencaminados, los troncales de fibra y los colectores de refrigeración líquida equipados con acopladores de acoplamiento ciego permiten conectar contenedores adyacentes en un único clúster lógico. Esta interconexión plug-and-play elimina el cableado de campo y la fontanería, reduciendo el tiempo de despliegue a semanas.

Escalado de clústeres: ¿Necesitas más computación? Añada otro contenedor en paralelo. ¿Necesita trasladarse? Desenchúfelo, súbalo a una plataforma y vuelva a instalarlo. Esta verdadera modularidad le ofrece un modelo de “pago a medida que crece”, evitando el exceso de aprovisionamiento típico de las construcciones tradicionales.

Módulos funcionales dentro de un contenedor

Cada contenedor AIDC se subdivide en módulos funcionales específicos, integrados en fábrica e intercambiables sobre el terreno.:

  • Módulo TI - Racks de servidores GPU/XPU (por ejemplo, NVIDIA HGX), además de switches y nodos de almacenamiento en la parte superior del rack (ToR)..
  • Módulo de alimentación - SAI de alta densidad, armarios con baterías de litio y paneles de distribución. Para una densidad ultraalta, fabricantes como Huawei ofrecen Power PODs de 3,2 MW en una sola caja que admiten 3,2 MW en un único contenedor de transporte..
  • Módulo de refrigeración - Sistemas de refrigeración líquida que van desde placas frías directas al chip hasta tanques de inmersión total.
  • Módulo de red - Conmutadores de espina/hoja de gran ancho de banda con transceptores ópticos integrados.
  • Módulo de gestión - Controladores DCIM con supervisión remota, mantenimiento predictivo y optimización basada en IA.

Desglose de los componentes de un contenedor AIDC

Ahora abramos la puerta del contenedor y miremos dentro.

Recinto informático de alta densidad (el “cerebro”)

El armario informático aloja su potencia de procesamiento de IA. Los bastidores dentro de un contenedor AIDC están configurados para 60-100 kW por bastidor, y cada bastidor puede alojar varios servidores GPU de 4U o nodos XPU de 2U.. Los tradicionales bastidores abiertos con ventiladores en la puerta trasera no funcionarán aquí; en su lugar, los chasis sellados con el flujo de aire bloqueado de delante hacia atrás y las placas frías montadas directamente en los procesadores permiten las densidades extremas necesarias para el entrenamiento y la inferencia de IA.

Unidad de distribución de energía (el “corazón”)

Dado que la densidad de potencia define la infraestructura de IA, toda la cadena eléctrica está diseñada para suministrar una corriente elevada con una alta eficiencia. Empezando por la alimentación de la red pública, un AIDC contenedor suele integrar:

  • Plataforma para transformadores de media tensión (si la utilidad externa es MV).
  • Cuadro general de baja tensión con interruptor de transferencia automática (ATS) para la conmutación por error del generador.
  • SAI modular - Para un clúster de 1 MW, es posible que haya dos módulos SAI de 600 kVA en paralelo. Los SAI modernos alcanzan una eficiencia del 99,1% en modo S-ECO, lo que reduce drásticamente la pérdida de energía..
  • Armarios para baterías de iones de litio - Densidad energética 4 veces superior a la del plomo-ácido, vida útil de más de 15 años, con BMS basado en la nube para la supervisión del nivel de célula y la detección de embalamiento térmico..
  • Unidades de distribución de energía (PDU) - Las PDU inteligentes por bastidor informan de los kW, la tensión, la corriente y el factor de potencia por salida en tiempo real.

Sistema de refrigeración líquida (los “pulmones”)

Este es el factor diferenciador más importante con respecto a los centros de datos convencionales. La refrigeración por aire tiene un límite de 15-20 kW por rack; las GPU de IA modernas exigen 50-150 kW. La refrigeración líquida es la respuesta obligatoria.

Los AIDC de contenedor admiten múltiples topologías de refrigeración líquida:

  • Directo a chip (placa fría) - El refrigerante circula por microcanales en una placa fría montada directamente en la matriz del procesador, eliminando entre 500 y 2000 W por chip. Es la opción más utilizada para clústeres de GPU de alta densidad.
  • Refrigeración por inmersión (monofásica o bifásica) - Los servidores enteros se sumergen en fluido dieléctrico. El fluido absorbe el calor y circula a través de un intercambiador de calor externo. Este enfoque elimina por completo los ventiladores, lo que permite un PUE tan bajo como 1,05.

Ambos métodos comparten la misma arquitectura de circuito cerrado: una unidad de distribución de refrigeración primaria (CDU) hace circular el refrigerante a través de los bastidores, rechazando el calor hacia un enfriador seco exterior, una torre de refrigeración o el sistema de agua fría de las instalaciones.

Contenedor AIDC

Medio ambiente y extinción de incendios

El grado de estanqueidad industrial (IP55 o superior) garantiza que no penetren el polvo, la sal ni la humedad. Para la extinción de incendios se utilizan sistemas de tubería seca de acción previa o de agente limpio (Novec 1230 o FM-200), con detectores de calor y humo en cada subcompartimento. Los contenedores de inmersión en líquido tienen la ventaja única de que el propio fluido dieléctrico los suprime, por lo que no necesitan ningún sistema químico añadido.

Gestión inteligente y observabilidad

Un AIDC contenedor no es una “caja tonta”, sino una instalación totalmente instrumentada y gestionada por IA. Una pasarela de gestión de infraestructuras de centros de datos (DCIM) integrada agrega datos de sensores procedentes de miles de puntos: temperatura por GPU, caudales de refrigerante, carga del SAI, corriente de derivación de la PDU, detección de fugas, contactos de puerta, etc. A partir de estos datos, los algoritmos de IA ejecutan análisis predictivos, alertando de un ventilador del SAI que está fallando. A partir de estos datos, los algoritmos de IA ejecutan análisis predictivos, alertando de un ventilador del SAI que falla antes de que se dispare o reequilibrando la carga de computación para evitar puntos calientes térmicos..

Cómo se despliega un contenedor AIDC

El despliegue de un contenedor AIDC sigue un flujo de trabajo predecible y acelerado, facilitado por la prefabricación en fábrica y la construcción en paralelo.

Paso 1 - Preparación del emplazamiento (en paralelo a la construcción en fábrica). Se prepara una plataforma de hormigón nivelada o una parcela de asfalto con acometidas de servicios públicos: alimentadores de media o alta tensión, conductos de fibra y tuberías de suministro y drenaje de agua (si se utiliza refrigeración evaporativa). Dado que los contenedores se colocarán en su lugar mediante grúa, no se requiere ninguna estructura de construcción ni ningún sistema de grúa aérea.

Paso 2 - Integración en fábrica y pruebas. Mientras se prepara el emplazamiento, el fabricante monta cada contenedor en un entorno de fábrica controlado. Se rellenan los bastidores informáticos, se colocan los cables, se instalan y cargan las baterías de los SAI, se llenan los circuitos de refrigeración y se comprueba su presión, y se realizan pruebas de integración del sistema durante más de 72 horas.

Paso 3 - Transporte y colocación in situ. Los contenedores terminados se cargan en camiones de plataforma y se entregan. Una grúa móvil eleva cada contenedor sobre la plataforma preparada, apilándolos uno al lado del otro o hasta cuatro capas de altura en caso de espacio limitado..

Paso 4 - Interconexión y rodaje. Los contenedores se atornillan mecánicamente. Se acoplan los conductos de alimentación y los troncales de fibra preencaminados, y los colectores de refrigeración líquida se conectan mediante acoplamientos ciegos. La pasarela DCIM integrada se enciende para la supervisión remota y una prueba de rodaje de 48 horas pone en funcionamiento todos los subsistemas bajo carga simulada.

Plazo total desde el pedido hasta la operación: De 4 a 6 meses para el despliegue inicial, o tan sólo 15 días para la expansión de un clúster dentro de una zona de implantación de AIDC ya existente..

Prefabricación en fábrica: El secreto de una entrega rápida

La construcción tradicional de un centro de datos es secuencial: excavar los cimientos, levantar el acero, verter el suelo, instalar la electricidad, instalar la mecánica, instalar los equipos informáticos. Cualquier retraso repercute en todo el programa. Container AIDC da la vuelta a este modelo.

Todo sucede en paralelo:

  • La obra civil prepara la plataforma en el emplazamiento del cliente.
  • La fábrica construye los contenedores.
  • El proveedor prueba el sistema integrado.

Dado que los contenedores se construyen conforme a las dimensiones y especificaciones de interfaz ISO estándar, pueden transportarse en cualquier camión de plataforma, vagón de ferrocarril o buque de carga. Para la interconexión in situ se utilizan conductos de bus, troncales de fibra y colectores de líquido estandarizados con acopladores ciegos.

Este montaje modular reduce drásticamente los plazos de entrega: los proyectos pueden estar operativos en menos de la mitad de tiempo que las construcciones tradicionales.. Proveedores líderes como Huawei han llevado a cabo más de 130 proyectos AIDC utilizando esta metodología..

Contenedor AIDC frente a centro de datos tradicional: Desglose de características

AspectoCentro de datos tradicional refrigerado por aireContenedor AIDC
Densidad máxima de bastidor10-20 kW50-150 kW (refrigeración líquida)
PUE típico1.5–1.81.05–1.15
Calendario de implantación12-24 meses4-6 meses
Tecnología de refrigeraciónAire (CRAC/CRAH)Líquido (directo a chip o inmersión)
Eficacia de la cadena cinemáticaMódulo SAI 94-96%Modo S-ECO 99.1%
Huella física por MW~200-300 metros cuadrados~50-100 metros cuadrados
EscalabilidadAmpliación de todo el edificioAñadir contenedores modularmente
ReubicableNoSí (transportable en camión)
Pruebas previas en fábricaNoPrueba integrada completa antes del envío
Acceso a los serviciosPasillos calientes/fríos basados en pasillosChasis de puerta trasera o extraíble

La cartera de contenedores producidos

Los proveedores de AIDC para contenedores ofrecen una línea de productos escalonada para adaptarse a las distintas escalas de implantación. La siguiente tabla ilustra una estructura de cartera típica.

SerieFactor de formaCarga totalDensidad de bastidoresLo mejor para
Serie I - Clúster de alta densidad40 pies ISO1 MW100 kW/rackEntrenamiento LLM a gran escala, más de 1.000 clusters de GPU
Serie II - Estándar integrado40 pies ISO480 kW60 kW/rackDespliegue rápido, infraestructura energética externa limitada
Serie III - Edge Compact20 pies ISO200 kW50 kW/rackEdge computing, ciudades inteligentes, laboratorios de investigación con limitaciones de espacio
Serie IV - Refrigeración por inmersión40 pies ISO~700 kW50 kW/rackEntornos hostiles (desiertos, minas), regiones tropicales que requieren un funcionamiento sin ventilador

Todas las series se suministran como unidades totalmente integradas y probadas: sólo hay que conectar las utilidades externas y desplegarlas.. Este enfoque productivo convierte la capacidad de los centros de datos de IA en un artículo de catálogo, que se encarga como los equipos informáticos de la empresa, en lugar de un inmueble diseñado a medida.

Listo para su futuro con IA

Las soluciones Container AIDC redefinen fundamentalmente lo que puede ser un centro de datos de IA: precisos de fábrica, refrigerados por líquido, escalables modularmente y desplegables en meses en lugar de años. En SOETECK, el Refrigeración líquida en contenedor AICoolit™ está diseñada para ofrecer una densidad extrema: hasta 100 kW por rack, PUE tan bajo como 1,15, desde pods de 200 kW hasta clusters de supercomputación de 1 MW.. Sin retrasos en la construcción. Sin techos de densidad de potencia. Sólo infraestructura de IA que se despliega tan rápido como el tren de sus modelos.

Sobre el autor

Gavin

Gavin

Gavin es director de operaciones en una empresa especializada en equipos de soporte para centros de datos. Es experto en sistemas de alimentación ininterrumpida específicos para centros de datos, aire acondicionado de precisión y soluciones para centros de datos. Él puede ayudarle a entender mejor estos productos y cómo elegir diferentes soluciones.

Puestos relacionados