El almacenamiento se está convirtiendo en un desafío térmico en los centros de datos de IA actuales

3.089 Visitas Totales , 3.089 Visitas Hoy
Por Alejandro Thomas, Application Engineer (Thermal) en Vertiv

La IA está cambiando no solo la forma en que se procesan los datos, sino también cómo se almacenan, se accede a ellos y se trasladan. A medida que los sistemas de almacenamiento escalan para admitir conjuntos de datos cada vez mayores, un mayor rendimiento y una utilización constante, se están convirtiendo en un importante contribuyente a la carga térmica dentro del centro de datos. En las operaciones impulsadas por IA, el calor ya no se genera principalmente solo por ráfagas transitorias de computación. Cada vez está más determinado por cargas de trabajo continuas e intensivas en almacenamiento que plantean nuevas exigencias a la infraestructura de refrigeración.

Para los operadores de centros de datos, esto introduce un conjunto diferente de desafíos. Se espera que las plataformas de almacenamiento ofrezcan un funcionamiento constante durante largos periodos, a menudo bajo una carga elevada, al tiempo que mantienen la resiliencia y la previsibilidad. Cumplir esas expectativas requiere un enfoque más integrado de la gestión térmica, que considere cómo el comportamiento térmico se propaga desde los dispositivos y racks de almacenamiento a través del conjunto de la instalación.

Las cargas de trabajo continuas implican calor continuo

Los sistemas consolidados de almacenamiento empresarial se diseñaron para patrones de acceso variables. Los picos de actividad solían ser de corta duración, permitiendo que los sistemas de refrigeración absorbieran y se recuperaran de los picos térmicos. Las cargas de trabajo de IA cambian este perfil. Los procesos de entrenamiento, la preparación de datos a gran escala y la inferencia a escala generan un acceso prolongado y de alto rendimiento al almacenamiento. Las matrices basadas en NVMe, los sistemas flash de alta densidad y los nodos de almacenamiento densamente empaquetados funcionan con una utilización constantemente elevada, produciendo un calor sostenido en lugar de ráfagas cortas.

Con el tiempo, esta carga térmica continua puede someter a tensión tanto al hardware de almacenamiento como a la infraestructura circundante. En este contexto, la estabilidad térmica se vuelve crítica. Incluso pequeñas variaciones de temperatura pueden afectar a la fiabilidad de los dispositivos, las tasas de error y el funcionamiento a largo plazo. Para los equipos de almacenamiento, esto significa que el calor ya no puede tratarse como una preocupación secundaria de la instalación. Puede influir directamente en la calidad del servicio y en la longevidad del sistema.

Captación de calor en infraestructuras de almacenamiento densas

A medida que aumenta la densidad de almacenamiento, eliminar el calor de forma eficiente de los bastidores y racks se vuelve más complejo. Los enfoques tradicionales basados en flujo de aire presentan dificultades cuando los sistemas están densamente empaquetados y funcionan de manera continua, ya que aumenta la resistencia al flujo de aire y se incrementa el consumo energético de los ventiladores.

Cada vez se consideran más los enfoques híbridos que integran métodos de refrigeración líquida y por aire para sistemas con una fuerte carga de almacenamiento, especialmente allí donde se despliegan matrices flash de alto funcionamiento o plataformas convergentes de IA. Al eliminar el calor más cerca de su origen, estos sistemas reducen los gradientes térmicos y favorecen condiciones operativas más previsibles.

A nivel de rack, la refrigeración híbrida permite a los operadores centrarse en los sistemas de almacenamiento con mayores exigencias térmicas sin rediseñar salas completas. Esto favorece una evolución gradual, permitiendo que las plataformas de almacenamiento escalen en funcionamiento y densidad mientras mantienen márgenes térmicos aceptables.

Captación de calor a nivel de sala en entornos de almacenamiento mixtos

La mayoría de los centros de datos admiten una combinación de almacenamiento y computación, a menudo con características térmicas diferentes. Esto significa que los racks refrigerados por aire y por líquido pueden situarse directamente uno junto a otro o en filas adyacentes. En estas configuraciones, la forma en que se recoge y gestiona el calor a nivel de sala adquiere una importancia creciente. Las soluciones intermedias, como los intercambiadores de calor de puerta trasera y la refrigeración de filas, ayudan a captar el calor de los racks de almacenamiento densos antes de que se disperse en el espacio circundante. Esto reduce la carga térmica sobre los sistemas centrales y estabiliza las temperaturas de entrada de los equipos adyacentes.

Más allá de las soluciones localizadas, el diseño a escala de sala desempeña un papel fundamental. Las unidades de tratamiento de aire perimetrales y las tecnologías de pared térmica se utilizan para definir las trayectorias del flujo de aire en los límites de la sala de datos, permitiendo una recogida controlada del calor tanto en entornos con suelo técnico elevado como sin él. Para las instalaciones con gran carga de almacenamiento, esto ayuda a evitar la recirculación y permite una refrigeración constante para sistemas que deben funcionar continuamente con una utilización elevada.

Estos elementos arquitectónicos proporcionan la base para salas de densidad mixta, donde las plataformas de almacenamiento, los aceleradores de IA y la computación de propósito general coexisten sin comprometer la estabilidad térmica.

Estrategias de rechazo de calor para funcionamiento continuo

Una vez capturado el calor, debe eliminarse de forma eficiente para favorecer el funcionamiento a largo plazo. Las cargas de trabajo de almacenamiento, con su producción térmica continua, ponen especial énfasis en la eficiencia y fiabilidad de la planta de refrigeración. El calor residual también puede reutilizarse para calefacción urbana o procesos industriales.

A medida que los centros de datos avanzan hacia temperaturas operativas más elevadas, el ajuste de la refrigeración está cobrando importancia. Al funcionar con temperaturas elevadas del agua o de los componentes, esto permite ampliar el uso de free-cooling y reducir la dependencia de compresores. Esto proporciona flexibilidad para gestionar condiciones operativas imprevisibles y se alinea bien con los sistemas de almacenamiento diseñados para un funcionamiento en estado estacionario, donde los perfiles térmicos previsibles permiten a los operadores aprovechar plenamente las condiciones ambientales.

Al mismo tiempo, las tecnologías de chillers centrífugos siguen siendo esenciales en muchas instalaciones. Allí donde se requieren temperaturas de suministro más bajas para proteger hardware de almacenamiento sensible, o donde la capacidad de refrigeración continua es crítica independientemente de las condiciones ambientales, los sistemas centrífugos proporcionan una base estable y escalable para el rechazo de calor. Esto permite una máxima eficiencia de refrigeración, haciendo posible asignar más potencia a las cargas de trabajo de IA.

Más que soluciones competidoras, estos enfoques reflejan diferentes prioridades operativas y etapas de madurez de la infraestructura. La elección adecuada depende de las características de las cargas de trabajo, los requisitos de funcionamiento y los planes de crecimiento a largo plazo.

Control, visibilidad y confianza operativa

Para los operadores de almacenamiento, la visibilidad es clave. Comprender cómo se comporta el calor a través de racks, salas y sistemas de planta proporciona la confianza necesaria para impulsar el funcionamiento sin poner en riesgo la fiabilidad.

Las plataformas modernas de control integran datos de sensores a lo largo de toda la cadena térmica, permitiendo que los sistemas de refrigeración respondan al comportamiento real de las cargas de trabajo en lugar de a supuestos estáticos.

Esto posibilita un control más preciso de las temperaturas, perfiles de demanda más

estables y un uso más eficiente de la capacidad de refrigeración.

Con el tiempo, estos datos también ayudan a fundamentar una mejor planificación. La información sobre el comportamiento térmico en condiciones reales ayuda a los equipos de almacenamiento a evaluar nuevas plataformas, modelar el crecimiento futuro y evitar el sobredimensionamiento que añade costes sin aportar resiliencia. Cuando cuentan con el respaldo de servicios integrales que proporcionan soporte de extremo a extremo, desde el diseño y la puesta en marcha hasta la optimización continua, la fiabilidad continua puede mejorarse mediante despliegues expertos y mantenimiento proactivo.

El calor como factor en la escalabilidad del almacenamiento

A medida que continúa el crecimiento de datos impulsado por IA, los sistemas de almacenamiento seguirán siendo un pilar central de la infraestructura digital. Su capacidad para escalar de manera fiable depende no solo de la capacidad y el funcionamiento, sino también de la eficacia con la que se gestione el calor en toda la instalación.

Tratar el calor como una consideración a nivel de sistema, en lugar de como una limitación de fondo, permite tomar decisiones más fundamentadas en cada etapa del despliegue. Desde el diseño de racks y la distribución de las salas hasta la selección de planta y la estrategia de control, el planteamiento térmico se está convirtiendo en una parte integral de la arquitectura de almacenamiento.

En los centros de datos de IA, el funcionamiento del almacenamiento y la gestión térmica están cada vez más interrelacionados. Los operadores que reconozcan y planifiquen esta conexión estarán mejor posicionados para respaldar el crecimiento continuo, proteger la fiabilidad y extraer valor a largo plazo de sus inversiones en infraestructura.

(datacenterdynamics.com)

Seguiremos brindándote más información sobre este tema en las siguientes presentaciones físicas y digitales de Channel News Perú

Mantente conectado a nuestra plataforma de negocios y revista, haciendo clic aquí y suscribiéndote a nuestro newsletter para contenido de valor diario

Digiqole Ad
...

Notas Relacionadas