Сборный контейнерный центр обработки данныхМодульный центр обработки данных с проходамиМодульный центр обработки данных RowШкаф модульного центра обработки данных

Почему ваш следующий блок CDU для центра обработки данных сделает или сломает производительность ИИ

поделиться с:

CDU для центра обработки данных является центральным теплообменным модулем жидкостной системы охлаждения ЦОД. Он циркулирует хладагент через холодные пластины, которые напрямую улавливают тепло от CPU и GPU, а затем передаёт это тепло в основной охлаждающий контур объекта.

При выборе CDU для развертывания в центре обработки данных операторы должны ориентироваться в сложном ландшафте технических спецификаций, архитектурных решений и эксплуатационных требований. Данное руководство предоставляет систематизированную основу для выбора правильного CDU для вашей конкретной среды.

CDU для центра обработки данных

Шаг 1: Оцените требования к тепловой мощности и плотности энергии

Тепловая мощность - краеугольный камень любого CDU для центра обработки данных. Ваш CDU должен выдерживать общую расчетную мощность системы - количество тепла, выделяемого вашими серверами и графическими процессорами. Как правило, планируйте тепловую нагрузку наиболее энергоемких стоек и общую нагрузку на каждый вычислительный модуль..

Современные блоки CDU отличаются удивительным диапазоном мощностей. Для малых и средних масштабов развертывания CDU, устанавливаемые в стойку и в ряд, обычно обеспечивают мощность от 70 кВт до 600 кВт. Устройства масштаба предприятия покрывают от 2 МВт до 4 МВт на модуль, а CDU гипермасштабного класса могут достигать 10 МВт на модуль и выше - компания Carrier недавно представила CDU мощностью от 1,3 МВт до 5 МВт для гипермасштабных центров обработки данных..

При определении размера CDU для центра обработки данных учитывайте не только текущие тепловые нагрузки, но и прогнозируемый будущий рост. Рабочие нагрузки ИИ быстро растут, и повторный ввод в эксплуатацию системы охлаждения обойдется гораздо дороже, чем первоначальный перерасход ресурсов.

Шаг 2: Рассчитайте скорость потока и напор

Скорость потока напрямую связана с производительностью охлаждения. Современные кластеры искусственного интеллекта и высокопроизводительных вычислений требуют более высокой скорости потока, чем когда-либо - обычно от 1,5 до 2 литров в минуту на киловатт тепла.. Недооценка требований к потоку приводит к недостаточному отводу тепла и тепловому дросселированию, что напрямую влияет на производительность GPU и время обучения.

Насосы CDU должны создавать достаточный напор, чтобы проталкивать охлаждающую жидкость через каждый контур, изгиб и холодную пластину в вашей системе. Проектировщики систем часто недооценивают падение давления, особенно при модернизации, когда существующие конфигурации трубопроводов не были рассчитаны на жидкостное охлаждение.

Шаг 3: Выбор между жидкостно-жидкостными и жидкостно-воздушными CDU

CDU обычно делятся на две основные архитектуры:

CDU, работающие по принципу "жидкость в жидкость" (L2L) Используют теплообменники для передачи тепла от контура охлаждающей жидкости ИТ-системы к системе охлажденной воды объекта. Их лучше всего использовать в крупных или высокопроизводительных центрах обработки данных с существующей инфраструктурой охлажденной воды. L2L CDU обеспечивают более высокую эффективность охлаждения, но требуют наличия систем водоснабжения объекта и надлежащих протоколов водоподготовки..

CDU, работающие по принципу "жидкость-воздух" (L2A) отводят тепло непосредственно в окружающий воздух в ЦОД с помощью встроенных вентиляторов и змеевиков. Они подходят для небольших развертываний или объектов без доступа к охлажденной воде, хотя и увеличивают тепловую нагрузку на зал обработки данных.Выбирая L2A CDU для центра обработки данных, помните, что он повысит температуру окружающей среды в помещении.

Шаг 4: Оцените типы CDU в зависимости от места развертывания

Помимо метода теплообмена, CDU классифицируются по месту расположения в помещении:

Стоечные модули CDU Устанавливаются непосредственно в отдельные серверные стойки, обеспечивая специальное охлаждение для конкретного шкафа. Они идеально подходят для стоек высокой плотности или модернизации, где интеграция на уровне рядов нецелесообразна. Примером этой категории являются CoolChip CDU 70 и CDU 100 от Vertiv, специально созданные для инфраструктуры искусственного интеллекта.

Рядовые CDU Располагаются между стойками в конфигурации "горячий/холодный проход", обслуживая несколько стоек от одного блока. Это наиболее распространенная схема развертывания корпоративных кластеров ИИ. Для большинства новых проектов CDU в ряду для центра обработки данных предлагает наилучший баланс плотности и удобства обслуживания.

Шаг 5: Понимание однофазной и двухфазной технологии

Однофазное охлаждение непосредственно на кристалле в настоящее время является доминирующим выбором для центров обработки данных ИИ. В этой архитектуре охлаждающая жидкость поглощает тепло от процессоров и возвращается в CDU в виде жидкости, где она охлаждается и рециркулирует. Технология является зрелой, хорошо изученной и поддерживается широкой экосистемой поставщиков.

Двухфазное охлаждение непосредственно на кристалле представляет собой новую альтернативу. Охлаждающая жидкость превращается из жидкости в пар по мере поглощения тепла, а затем снова конденсируется в жидкость в CDU. Фазовый переход позволяет значительно повысить теплопроводность при меньших расходах и снизить энергию насоса.. Однако двухфазные системы требуют больших затрат и требуют соблюдения нормативных требований, особенно в отношении хладагентов и их потенциала глобального потепления.

CDU для центра обработки данных

Для большинства корпоративных развертываний сегодня однофазные блоки CDU L2L остаются самым надежным и экономичным выбором блока CDU для центра обработки данных. Двухфазная технология лучше всего подходит для сред ИИ и высокопроизводительных вычислений с самой высокой плотностью, где важен каждый ватт эффективности охлаждения, а бюджеты на капитальные вложения позволяют использовать специализированную инфраструктуру.

Шаг 6: Укажите требования к избыточности и надежности

Резервирование N+1 - добавление одного дополнительного блока CDU сверх того, что требуется для удовлетворения полной тепловой нагрузки, - стало минимальным отраслевым стандартом при проектировании систем охлаждения. Такой подход позволяет продолжать работу при отказе компонентов, плановом обслуживании или изменении нагрузки. Для критически важных рабочих нагрузок ИИ операторы все чаще выбирают конфигурации 2N CDU, хотя это связано со значительными пространственными и капитальными затратами.

Помимо резервирования на уровне блока, ищите CDU для центра обработки данных с резервными насосами (конфигурации N+1 или 2N), резервными сетчатыми фильтрами и датчиками, а также с двумя источниками питания. Открытые конструкции, обеспечивающие легкий доступ к насосам, фильтрам и элементам управления, сокращают время простоя во время технического обслуживания..

Шаг 7: Планирование устойчивости и долгосрочного масштабирования

При оценке установок CDU обратите внимание на поддержку более высоких температур отходящей воды. Системы, работающие при температуре теплоносителя до 40 °C, позволяют максимально увеличить время свободного охлаждения, сокращая потребление энергии чиллером и обеспечивая повторное использование тепла для централизованного теплоснабжения или других целей.. Возможность рекуперации тепла быстро превращается из приятной функции в обязательное требование, особенно в регионах, где действуют цены на выбросы углекислого газа или ставятся жесткие цели по обеспечению экологической безопасности.

Масштабируемость требует такой же продуманности. Рынок CDU для центров обработки данных стремительно растет, причем темпы роста прямого жидкостного охлаждения составляют от 20% до 30% в годовом исчислении, а к 2029 году объем рынка достигнет почти $6 млрд.. Этот стремительный рост привлек в сферу CDU около 40 поставщиков - от глобальных лидеров до нишевых специалистов.. Хотя конкуренция способствует инновациям, она также создает риск блокировки поставщиков или неиспользуемых активов.

Выберите CDU для центра обработки данных с модульными путями расширения, открытой архитектурой управления и совместимостью с несколькими типами охладителей. Наличие резервных мощностей позволяет масштабировать плотность стоек без замены всей инфраструктуры охлаждения. Запросите у продавцов информацию об эталонных развертываниях, аналогичных по масштабу планируемому объекту, и проверьте наличие запасных частей и сервисную поддержку в вашем регионе.

Заключительные соображения: ИИ, высокопроизводительные вычисления и будущее CDU

Рабочие нагрузки при обучении искусственному интеллекту непредсказуемо возрастают и циклически изменяются. Графические процессоры могут быстро увеличивать или уменьшать производительность, создавая мгновенные скачки температуры. CDU для сред ИИ должны постоянно регулировать скорость насосов, расход и положение клапанов, чтобы равномерно распределять тепловую нагрузку.. Для этого требуется усовершенствованная логика управления, а не просто насосы больших размеров.

Кластеры высокопроизводительных вычислений часто отличаются самой высокой плотностью развертывания в любом учреждении. В таких средах следует использовать специальные блоки CDU для каждого вычислительного блока, а не общие блоки для нескольких блоков. Такой подход позволяет создать зоны термических сбоев, упростить поиск и устранение неисправностей и согласовать мощность охлаждения с конкретными характеристиками рабочей нагрузки.

Помните: CDU для ЦОД - это не просто насос с теплообменником. Это интеллектуальный слой, который превращает жидкость из носителя в управляемый ресурс. Выбор правильного CDU для ЦОД - одно из самых важных инфраструктурных решений, которые вам предстоит принять в эпоху ИИ.

Об авторе

Гэвин

Гэвин

Гэвин - менеджер по операциям в компании, специализирующейся на вспомогательном оборудовании для центров обработки данных. Он разбирается в источниках бесперебойного питания для центров обработки данных, прецизионных кондиционерах и решениях для центров обработки данных. Он может помочь вам лучше понять эти продукты и выбрать различные решения.

Похожие посты