La tecnología de refrigeración líquida representa el centro de datos del mañana
En los últimos años, la IA generativa ha generado un entusiasmo casi universal, ya que las empresas se apresuran a aprovechar su potencial. Sin embargo, a pesar de todo el fervor, es importante considerar los requisitos energéticos necesarios para sostener esa tecnología.
La creación y el entrenamiento de modelos de IA generativa exigen enormes cantidades de energía, lo que genera un marcado aumento del consumo de energía y una mayor necesidad de recursos de computación de gran densidad. Los centros de datos están a la vanguardia de este aumento exponencial y se prevé que utilicen aún más energía a medida que esta tendencia continúe. El hardware que alimenta la IA generativa, en particular las GPU, consume mucha energía, lo que crea una necesidad urgente de soluciones innovadoras para gestionar el calor que generan estos sistemas.
¿Por qué se expone la refrigeración por aire?
Las GPU, que consumen mucha energía y que alimentan las plataformas de IA, requieren de cinco a diez veces más energía que las CPU, debido a la mayor cantidad de transistores. Esto ya está afectando a los centros de datos. También existen nuevas metodologías de diseño rentables que incorporan características como el apilamiento de silicio en 3D, que permite a los fabricantes de GPU colocar más componentes en un espacio más pequeño. Esto nuevamente aumenta la densidad de energía, lo que significa que los centros de datos necesitan más energía y generan más calor.
Otra tendencia que se está dando en paralelo es la caída constante de la TCase (o temperatura de la carcasa) en los chips más recientes. La TCase es la temperatura máxima segura para la superficie de los chips, como las GPU. Es un límite establecido por el fabricante para garantizar que el chip funcione sin problemas y no se sobrecaliente ni requiera una limitación que afecte al rendimiento. En los chips más nuevos, la TCase está bajando de 90 a 100 grados Celsius a 70 u 80 grados, o incluso menos. Esto está impulsando aún más la demanda de nuevas formas de enfriar las GPU.
La densidad también es muy importante. La refrigeración líquida nos permite colocar una gran cantidad de equipos en una gran densidad de racks. Con la refrigeración líquida, podemos llenar esos racks y utilizar menos espacio en el centro de datos en general, y menos espacio inmobiliario, lo que será muy importante para la IA.
Afrontando el desafío
A medida que aumentan las demandas energéticas de la IA generativa, los sistemas refrigerados por líquido surgirán como una solución esencial para satisfacer los requisitos de alta densidad energética. Estos sistemas no solo ayudan a las empresas a optimizar la eficiencia energética, sino que también permiten a los centros de datos gestionar la creciente cantidad de GPU que impulsan los avances futuros. Dadas las inmensas necesidades energéticas de la IA generativa, la refrigeración por aire se ha convertido en una opción inadecuada. La aparición de esta tecnología ha puesto a los centros de datos bajo la lupa y los ha expuesto más que nunca; sin embargo, esta es una gran oportunidad para tomar medidas y adoptar soluciones innovadoras que estén a la altura de este desafío.
Como resultado de estos factores, la refrigeración por aire ya no es suficiente en lo que respecta a la IA. No se trata solo de la potencia de los componentes, sino de la densidad de esos componentes en el centro de datos. A menos que los servidores se vuelvan tres veces más grandes de lo que eran antes, se necesita una eliminación eficiente del calor. Eso requiere un manejo especial, y la refrigeración líquida será esencial para respaldar la implementación generalizada de la IA.
Una tendencia emergente
La refrigeración líquida está ganando popularidad. Las instituciones de investigación públicas estuvieron entre los primeros usuarios, ya que suelen solicitar lo último y lo mejor en tecnología de centros de datos para impulsar la computación de alto rendimiento y la inteligencia artificial. Sin embargo, tienden a tener menos temores en torno al riesgo de adoptar una nueva tecnología antes de que ya esté establecida en el mercado.
Los clientes empresariales son más reacios a asumir riesgos. Necesitan asegurarse de que lo que implementen les proporcionará un retorno inmediato de la inversión. Ahora estamos viendo que cada vez más instituciones financieras (a menudo conservadoras debido a los requisitos regulatorios) adoptan la tecnología, junto con la industria automotriz.
Estos últimos son grandes usuarios de sistemas HPC para desarrollar nuevos automóviles y, ahora, también son proveedores de servicios en centros de datos de colocation. La IA generativa tiene enormes requisitos de energía que la mayoría de las empresas no pueden satisfacer dentro de sus instalaciones, por lo que necesitan acudir a un centro de datos de colocation, a proveedores de servicios que puedan proporcionar esos recursos computacionales. Esos proveedores de servicios están haciendo la transición a nuevas arquitecturas de GPU y refrigeración líquida. Si implementan refrigeración líquida, pueden ser mucho más eficientes en sus operaciones.
Por qué es fundamental la refrigeración líquida
La refrigeración líquida ofrece resultados tanto en servidores individuales como en centros de datos más grandes. Al pasar de un servidor con ventiladores a un servidor con refrigeración líquida, las empresas pueden lograr reducciones significativas en lo que respecta al consumo de energía. Pero esto solo ocurre a nivel de dispositivo, mientras que la refrigeración perimetral (eliminación del calor del centro de datos) requiere más energía para enfriar y eliminar el calor. Eso puede significar que solo dos tercios de la energía que utiliza el centro de datos se destinan a la computación, la tarea para la que está diseñado el centro de datos. El resto se utiliza para mantener el centro de datos refrigerado.
La eficacia del uso de la energía (PUE) es una medida de la eficiencia de los centros de datos. Se toma la energía necesaria para hacer funcionar todo el centro de datos, incluidos los sistemas de refrigeración, dividida por los requisitos de energía del equipo de TI. En el caso de los centros de datos optimizados con líquido, algunos de ellos tienen una PUE de 1,1 y otros incluso de 1,04, lo que significa una cantidad muy pequeña de energía marginal. Eso es antes de que consideremos siquiera la oportunidad de tomar este líquido o agua caliente que sale de los racks y reutilizar ese calor para hacer algo útil, como calentar el edificio en invierno, que vemos que algunos clientes hacen hoy en día.
(datacenterdynamics.com)
Les estaremos informando con mucho más detalle, en el marco del informe especial: “Soluciones de infraestructura de Data centers y edge computing, componentes activos (UPS, AAC, generadores, tableros eléctricos, PDU) y pasivos (cables, gabinetes, pisos, accesorios, conectores), ciberseguridad, seguridad (perimétrica y de data) y controles (cámaras, extinguidores de gas, tableros de acceso). Energía limpia: generadores solares de energía para Data centers. Equipamiento integral para y hacia la nube. Cableado y gestión de cableado estructurado. Buenas prácticas ambientales», que estamos preparando para nuestra edición 212 y publicaremos en el mes de enero.
Mantente conectado a nuestra revista Channel News Perú, haciendo clic aquí y suscribiéndote a nuestro newsletter para contenido de valor diario.