¿Pueden realmente escalar los centros de datos?

Loading

Por Baratunde Cola, cofundador y director ejecutivo de Carbice

Detrás del auge de la inteligencia artificial de los últimos años se esconde una batalla discreta: centros de datos que compiten por mantenerse al día con un consumo energético sin precedentes.

La cuestión es clara: las GPU que impulsan los avances en inteligencia artificial requieren enormes cantidades de energía y producen un calor significativo.

Tomemos el modelo GB200 NVL72 de Nvidia, que contiene 72 GPU GB200 y 36 CPU Grace, pero que se vio obligado a sufrir un rediseño de rack después de recibir reclamos de sobrecalentamiento en la configuración original.

Al mismo tiempo, el consumo energético global de los centros de datos sigue aumentando y representa el 1,5 por ciento del consumo total de electricidad en todo el mundo. Se estima que, para 2030, los centros de datos de Estados Unidos consumirán alrededor del ocho por ciento de la energía total del país y requerirán inversiones en servicios públicos de hasta 50.000 millones de dólares.

Esta creciente demanda plantea una pregunta importante: ¿pueden nuestra infraestructura y nuestros recursos mantener el ritmo? Empresas como Microsoft están explorando alternativas audaces, como el aprovechamiento de reactores nucleares. Sin embargo, a pesar de los numerosos enfoques innovadores, la red eléctrica tiene dificultades para satisfacer la creciente demanda de centros de datos, y los proyectos ambiciosos están sufriendo grandes retrasos y sobrecostos elevados.

Desafíos que enfrentan los centros de datos impulsados ??por IA

A medida que aumentan las cargas de trabajo de la IA, también aumentan los desafíos que enfrentan los centros de datos. Las demandas de energía están aumentando y la competencia por componentes críticos como las GPU de alto rendimiento se está intensificando, lo que hace que las cadenas de suministro sean arriesgadas. La escasez de terrenos, en particular en regiones con acceso limitado a la energía y al espacio para la infraestructura, complica aún más los esfuerzos.

Al mismo tiempo, la naturaleza cíclica del entrenamiento de la IA oscila entre tareas de computación y de uso intensivo de la memoria para generar tensiones térmicas fluctuantes que los métodos de refrigeración tradicionales ya no pueden gestionar. Como resultado, las soluciones de vanguardia como la refrigeración líquida y los materiales de interfaz térmica innovadores (TIM), utilizados para mantener todas las soluciones de refrigeración en contacto funcional, ya no son una opción. Son esenciales.

Las empresas se enfrentan entonces a la difícil tarea de implementar rápidamente nuevas tecnologías de refrigeración a gran escala y al mismo tiempo controlar los costos operativos. Sin embargo, estas mejoras pueden tener un impacto ambiental, ya que los sistemas de refrigeración consumen millones de litros de agua al día, un problema que se ha vuelto más urgente debido a la escasez mundial de agua.

Para abordar estos desafíos interconectados, los centros de datos deben equilibrar la escalabilidad con la sostenibilidad, garantizando un rendimiento confiable para ingenieros y empresas dentro del presupuesto y el tiempo establecidos, al tiempo que reducen su huella ambiental.

Soluciones de refrigeración innovadoras

Adoptar soluciones de enfriamiento innovadoras y escalables que se integren perfectamente en los centros de datos es la clave para superar estos desafíos.

Las interfaces térmicas tradicionales totalmente líquidas siguen siendo un obstáculo, ya que a menudo no ofrecen la fiabilidad y el rendimiento necesarios. En respuesta a ello, están ganando terreno soluciones emergentes, como los sistemas de refrigeración líquida de circuito cerrado, que prometen reducir el consumo de agua y, al mismo tiempo, mejorar el margen térmico para la refrigeración del sistema a fin de superar las temperaturas de interfaz más elevadas debido a los chips grandes y curvados.

Por otra parte, empresas como Meta han logrado una eficacia de uso de energía (PUE) de toda la flota de 1,10 en comparación con el promedio de la industria de 1,58 mediante el uso de técnicas de refrigeración avanzadas, como la aspiración de aire exterior para regular la temperatura, la refrigeración por evaporación y los sistemas de humidificación. Sin embargo, a medida que aumentan las densidades de potencia de los chips y los climas ideales para la refrigeración por aire exterior se vuelven menos accesibles, mantener esos niveles de eficiencia planteará desafíos cada vez mayores.

Sabemos que un enfriamiento confiable de alto rendimiento comienza en la interfaz, y los TIM avanzados están reemplazando las opciones tradicionales para satisfacer las demandas de los sistemas de enfriamiento de próxima generación a gran escala en la actualidad. Los TIM basados ??en carbono, por ejemplo, están ganando terreno rápidamente por su conductividad térmica y durabilidad superiores y su capacidad para conectar placas planas a chips curvos y mantener el contacto en todo el rango operativo del dispositivo. Estas innovaciones garantizan la continuidad operativa, mejoran la eficiencia y reducen el impacto ambiental.

Por qué es importante la refrigeración sostenible

Las soluciones de refrigeración sostenibles ofrecen muchas ventajas, como la prolongación de la vida útil del hardware, la reducción de los gastos de mantenimiento y la prevención de pérdidas de ingresos debido a tiempos de inactividad prolongados. Las GPU, que suelen tener una vida útil de entre tres y cinco años con cargas de trabajo intensas, pueden aumentar su vida útil en más del 60 por ciento con una refrigeración adecuada.

Además, dado que el calor es responsable de casi la mitad de todos los fallos, una refrigeración eficaz puede reducir las necesidades de mantenimiento hasta en un 50 por ciento. Los centros de datos dependen de sistemas de refrigeración modulares y fiables para lograr un tiempo de funcionamiento casi perfecto (99,995 por ciento o más). Incluso las interrupciones breves pueden provocar pérdidas significativas en sectores de gran importancia, como el financiero o el sanitario.

Desde una perspectiva ambiental, las tecnologías sostenibles ayudan a reducir la huella de carbono al minimizar el uso de energía para refrigeración. Los sistemas de reutilización de calor, que capturan y reutilizan el calor residual de los centros de datos, como las instalaciones que utilizan este calor para calentar los edificios cercanos, mejoran aún más los esfuerzos de sostenibilidad. Estas iniciativas están alineadas con objetivos de sostenibilidad más amplios, lo que ayuda a reducir la huella de carbono y contribuye a la conservación de la energía.

Las soluciones de refrigeración sostenibles están transformando el futuro de los centros de datos al mejorar la transferencia de calor y soportar las tensiones mecánicas de los chips modernos. Estas innovaciones garantizan un rendimiento constante, prolongan la vida útil de los componentes críticos y ayudan a evitar costosos tiempos de inactividad o pérdidas de datos.

El futuro de la refrigeración sostenible

La evolución de las innovaciones en materia de refrigeración ha supuesto desafíos inesperados. Aun así, las lecciones aprendidas en la búsqueda del equilibrio entre el rendimiento y la sostenibilidad son inestimables para quienes se enfrentan a las mismas exigencias de alto riesgo de la infraestructura impulsada por la IA.

Durante los próximos cinco a diez años, las soluciones de gestión térmica que utilizan materiales basados ??en carbono resistirán las crecientes densidades de potencia de las GPU y mantendrán el rendimiento, la conductividad térmica superior y la durabilidad.

Sin embargo, la fabricación de estos materiales también debe ser sostenible y escalable para evitar los desafíos de la cadena de suministro que se observan con el uso de grafito en las baterías. Los centros de datos también deben adaptarse incorporando microrredes y fuentes de energía renovables localizadas, como la energía nuclear, hidroeléctrica y solar. La transparencia en las asociaciones y la participación de las partes interesadas garantizarán la escalabilidad y la sostenibilidad a largo plazo de estas soluciones.

A medida que la IA sigue dando forma al futuro, la industria de los centros de datos debe afrontar el desafío de equilibrar las demandas térmicas y energéticas, todo ello sin comprometer sus resultados finales ni los recursos del planeta. El viaje hacia un futuro más ecológico y eficiente acaba de empezar, y las decisiones que se tomen hoy definirán la infraestructura del mañana.

(datacenterdynamics.com)

Les estaremos informando con mucho más detalle, en el marco del informe especial: “Soluciones de infraestructura de Data centers y edge computing, componentes activos (UPS, AAC, generadores, tableros eléctricos, PDU) y pasivos (cables, gabinetes, pisos, accesorios, conectores), ciberseguridad, seguridad (perimétrica y de data) y controles (cámaras, extinguidores de gas, tableros de acceso). Energía limpia: generadores solares de energía para Data centers. Equipamiento integral para y hacia la nube. Cableado y gestión de cableado estructurado. Buenas prácticas ambientales», que estamos preparando para nuestra edición 212 y publicaremos en el mes de febrero.

Mantente conectado a nuestra revista Channel News Perú, haciendo clic aquí y suscribiéndote a nuestro newsletter para contenido de valor diario.

Digiqole Ad

Notas Relacionadas