Del riesgo a la resiliencia: garantizar la continuidad en los centros de datos

El debate sobre la resiliencia de las infraestructuras nacionales críticas está cobrando cada vez más urgencia. Los centros de datos ocupan un lugar central en ese debate pues sustentan todo tipo de servicios, desde los financieros hasta la sanidad, el transporte y los sistemas gubernamentales.
Al mismo tiempo, el entorno en el que operan se está volviendo más difícil. Las amenazas cibernéticas siguen aumentando, la disponibilidad de energía es menos predecible y la infraestructura diseñada para las cargas de trabajo del pasado se ve ahora sometida a una presión que supera con creces sus límites originales.
La resiliencia ya no consiste en evitar por completo los fallos. Se trata de mantener el control cuando estos se producen.
Un panorama de amenazas creciente e interconectado
La ciberseguridad sigue siendo uno de los riesgos más inmediatos para la continuidad de los centros de datos. A medida que las redes se vuelven más distribuidas, también se vuelven más complejas. Esa complejidad conlleva más posibilidades de que se produzcan fallos o de que se produzcan vulnerabilidades.
El ransomware, los ataques de denegación de servicio y las amenazas internas siguen aumentando tanto en frecuencia como en sofisticación. El error humano sigue siendo un factor importante, ya sea a través de un intento de phishing exitoso o de un error de configuración cometido bajo presión. Incluso actividades rutinarias como la aplicación de parches y la actualización de sistemas pueden introducir nuevas vulnerabilidades si no se gestionan con cuidado.
Pero el riesgo cibernético es solo una parte del panorama. La fiabilidad del suministro eléctrico es una preocupación igualmente grave. Todavía se producen cortes en la red eléctrica en todo el Reino Unido y Europa, y cuando coinciden con fallos en los sistemas de respaldo, como que los sistemas de alimentación ininterrumpida no aguanten o que los generadores no arranquen, el impacto puede ser inmediato y generalizado.
La infraestructura de refrigeración introduce otra capa de riesgo. Los enfriadores, las bombas y los ventiladores son todos puntos potenciales de fallo. Las condiciones ambientales, como las olas de calor o las restricciones de agua, pueden llevar a los sistemas de refrigeración más allá de sus límites de diseño. Dado que la refrigeración depende de la energía eléctrica, un corte de suministro puede reducir rápidamente la capacidad de refrigeración y provocar que las temperaturas suban más rápido de lo que muchos operadores esperan. Incluso con redundancia implementada, un solo error de mantenimiento puede poner en riesgo el tiempo de actividad.
Toda esta presión se ve amplificada por la creciente demanda digital. Las cargas de trabajo de IA y aprendizaje automático requieren una densidad de computación significativamente mayor y generan mucho más calor que las aplicaciones tradicionales. Muchos centros de datos siguen utilizando una infraestructura que nunca se diseñó para este nivel de densidad, lo que supone una carga adicional tanto para los sistemas físicos como para los procesos operativos.
Estos riesgos no son teóricos. En junio de 2024, el centro de datos del Defra (Departamento de Medio Ambiente, Alimentación y Asuntos Rurales) del Gobierno del Reino Unido sufrió una interrupción del servicio de cuatro días de duración relacionada con un corte de suministro eléctrico en una instalación de alojamiento privada. En mayo de 2025, una interrupción global del servicio en X se atribuyó a un fallo del centro de datos. Sucesos como estos demuestran que incluso las organizaciones grandes y con abundantes recursos siguen siendo vulnerables cuando la resiliencia de la infraestructura es insuficiente.
Reducir la probabilidad de que se produzcan interrupciones y limitar su impacto cuando estas se producen requiere que la resiliencia se trate como una capacidad fundamental, en lugar de como un complemento opcional.
Incorporar la resiliencia a las operaciones diarias
La verdadera resiliencia significa mantener la continuidad en condiciones adversas, no solo durante las operaciones normales. Eso requiere visibilidad, control y la capacidad de actuar rápidamente cuando algo sale mal.
Dado que la disponibilidad de energía es cada vez menos predecible en el Reino Unido y en todo el mundo, los operadores de centros de datos no pueden confiar únicamente en medidas reactivas. El envejecimiento de la infraestructura, el aumento de la densidad de la carga de trabajo y las sofisticadas amenazas cibernéticas exigen un enfoque más deliberado de la resiliencia.
Las tecnologías que permiten la supervisión en tiempo real, la gestión de la configuración, la conmutación automática por error, la diversidad de rutas y el acceso remoto seguro desempeñan un papel importante. El objetivo es sencillo. Cuando se pierde el acceso o los sistemas se comportan de forma inesperada, los operadores necesitan una vía de retorno que no dependa de la misma red que está fallando.
La resiliencia también significa prepararse para lo que está por venir. La IA, la computación de alta densidad y las cargas de trabajo en constante evolución exigen arquitecturas de red capaces de adaptarse en tiempo real. Las redes definidas por software ayudan a cumplir ese requisito al proporcionar un plano de control flexible y programable que admite tanto la escalabilidad como la seguridad a medida que cambian las condiciones.
El tiempo de actividad no es una inversión puntual. Es una disciplina continua que debe evolucionar al mismo tiempo que las amenazas para las que está diseñada. Al dar prioridad al acceso independiente, la automatización y el control seguro, los operadores de centros de datos pueden mantener en funcionamiento los sistemas críticos, proteger los servicios de los que dependen millones de personas y fortalecer los cimientos digitales de la economía del Reino Unido.
(datacenterdynamics.com)
Seguiremos brindándote más información sobre este tema en las siguientes presentaciones físicas y digitales de Channel News Perú
Mantente conectado a nuestra plataforma de negocios y revista, haciendo clic aquí y suscribiéndote a nuestro newsletter para contenido de valor diario