Reimaginando la infraestructura TI para (y con) la IA agéntica
![]()

La infraestructura de TI está entrando en una nueva fase a medida que los agentes de IA orquestan, gestionan y escalan cada vez más el trabajo en toda la empresa. La infraestructura ya no actúa únicamente como una función de soporte o una capa de control; se convierte en la columna vertebral de un sistema orquestado que determina la eficacia con la que las organizaciones obtienen valor de la IA con agentes.
Sin embargo, con la expansión de las cargas de trabajo de IA, se prevé que los costes de la infraestructura de TI se multipliquen por dos o tres para 2030, mientras que los presupuestos se mantienen estables.<sup>1</sup> La última encuesta de McKinsey sobre el estado de la IA revela que, si bien el 62 % de las organizaciones están experimentando o implementando proyectos piloto con agentes de IA, la escalabilidad sigue siendo baja. En cualquier función empresarial, no más del 10 % de los encuestados afirma que sus organizaciones están escalando los agentes de IA.
Para los directores de tecnología (CTO), esto plantea un doble desafío urgente: actualizar la infraestructura para que sea lo suficientemente rápida, escalable y fiable como para soportar la IA con agentes, al tiempo que se utiliza la propia IA con agentes para contener el creciente coste de dicha actualización (véase el recuadro «La evolución de la infraestructura de TI»). Las empresas deben actuar con rapidez, dado que más de un tercio de las empresas de alto rendimiento destinan más del 20 % de sus presupuestos digitales a la IA.
La IA con agentes puede transformar radicalmente la forma en que se aprovisiona, gestiona y optimiza la infraestructura, con conectividad basada en intenciones, operaciones autónomas y una mínima supervisión humana. Nuestra experiencia indica que la IA con agentes puede automatizar entre el 60 % y el 80 % del trabajo rutinario de infraestructura con el tiempo, lo que se traduce en una reducción de costes operativos del 20 % al 40 % en las implementaciones iniciales, con beneficios adicionales a medida que aumenta la adopción. Sin embargo, esto requerirá que los CTO satisfagan una serie de necesidades, como la automatización, la simplificación del entorno, el rediseño del modelo operativo y la gobernanza activa de costes, al tiempo que mejoran la resiliencia y la velocidad de entrega.
Para respaldar este cambio, las organizaciones líderes están comenzando a rediseñar la infraestructura aplicando principios más comúnmente asociados con la arquitectura, como la modularidad, la componibilidad y la orquestación.
Tres puntos de presión para la infraestructura
A medida que las empresas buscan escalar sus programas de IA con agentes, los líderes de infraestructura se enfrentan a tres presiones estructurales:
• La infraestructura debe funcionar mucho más rápido y a gran escala. La innovación en IA con agentes está floreciendo, pero a menudo de forma aislada, lo que genera fragmentación y dificulta la reutilización de agentes y la escalabilidad. Como resultado, menos del 10 % de los programas con agentes alcanzan una escala significativa. Al mismo tiempo, la demanda aumenta a medida que los desarrolladores trabajan más rápido y se incrementa la necesidad de coordinar agentes, herramientas y datos en diferentes entornos. Los entornos diseñados para flujos de trabajo basados ??en tickets no pueden soportar este volumen de trabajo.
• Los costos no laborales aumentan rápidamente a medida que se expanden las cargas de trabajo de IA. El rápido crecimiento de la demanda de computación y almacenamiento (tanto local como en la nube), amplificado por la IA con agentes, está impulsando un aumento proyectado de dos a tres veces en los costos de infraestructura de TI para 2030.3 Al mismo tiempo, se espera que los presupuestos de infraestructura se mantengan relativamente estables.
• El riesgo de interrupción del servicio conlleva mayores consecuencias financieras que nunca. La resiliencia se ha vuelto inseparable de la reputación de la marca, la seguridad y el riesgo empresarial. Los sistemas se vuelven más complejos a medida que se adaptan a las necesidades de la IA con agentes, lo que crea más puntos de fallo y dificulta significativamente el mantenimiento de la observabilidad y el control.
Cómo luce una infraestructura preparada para agentes
Históricamente, la infraestructura se ha diseñado principalmente para operaciones dirigidas por humanos. En la era de los agentes, esto ya no es suficiente. A gran escala, se requiere más que actualizaciones incrementales. La infraestructura debe evolucionar hacia un diseño más modular, similar a una malla, donde los agentes, las herramientas y los sistemas empresariales se conectan a través de una capa de orquestación compartida. Esto permite la coordinación entre dominios, manteniendo el control y la reutilización.
Para lograr esta visión, cuatro capacidades fundamentales son cruciales:
• Acciones repetibles y ejecutables a través de API seguras. Las acciones repetibles deben ser accesibles como código con comprobaciones de políticas integradas.
• Datos operativos confiables. Fuentes de información claras sobre activos, dependencias, propiedad, registros y métricas reducen la ambigüedad y permiten una automatización segura. Los datos imperfectos no deben impedir el progreso. Muchos casos de uso de alto valor pueden implementarse incluso en entornos con fidelidad de base de datos inconsistente o repositorios fragmentados.
• Controles integrados y gobernanza de agentes. Los modelos de permisos deben definir qué acciones pueden realizar los agentes y bajo qué condiciones, con una identidad digital clara, propiedad y responsabilidad para cada agente. Todas las acciones deben registrarse, ser rastreables y auditables, y las políticas deben aplicarse en todos los entornos. Las acciones de alto impacto requieren aprobación humana, respaldada por mecanismos de supervisión para pausar o anular el comportamiento automatizado.
• Gestión del ciclo de vida, interoperabilidad y contexto de los agentes. Las organizaciones necesitan un inventario claro de los agentes implementados, un alcance definido para cada uno, seguimiento del rendimiento y gestión del ciclo de vida.
A medida que los agentes escalan, los equipos deben gestionar explícitamente el costo y el consumo de recursos, incluyendo la monitorización del uso de inferencias y los patrones de ejecución para evitar picos de costos inesperados. Los agentes operan cada vez más en diversos sistemas y plataformas, lo que requiere planos de control interoperables y patrones de integración. También dependen de una comprensión estructurada del entorno de TI, incluyendo dependencias, propiedad y modos de fallo conocidos, para operar de forma segura y tomar decisiones informadas.
Partiendo de esta base, las organizaciones líderes están convergiendo en un enfoque de infraestructura más similar a una malla, donde agentes, plataformas y sistemas se interconectan a través de una capa de orquestación compartida. En la práctica, esto introduce un conjunto de principios de diseño que definen el comportamiento de la infraestructura a gran escala:
• Componibilidad: Los componentes de infraestructura, agentes y herramientas se pueden reutilizar en diferentes flujos de trabajo sin necesidad de reelaboración.
• Desacoplamiento: Las capas de ejecución, orquestación y datos se separan para mejorar la escalabilidad y la flexibilidad.
• Flexibilidad del proveedor: Los componentes pueden evolucionar de forma independiente, reduciendo la dependencia de un proveedor específico y preservando la flexibilidad.
• Autonomía gobernada: Los agentes operan dentro de políticas definidas, con responsabilidades claras y rutas de escalamiento definidas.
La mayoría de las organizaciones ya utilizan plataformas como ServiceNow, herramientas de gestión en la nube, controladores de red y pilas de observabilidad, muchas de las cuales incorporan capacidades de IA. La decisión estratégica para las empresas no radica en si reemplazar estos sistemas, sino en cómo integrarlos en una estructura coherente que permita la coordinación y la reutilización entre dominios.
Desde el punto de vista arquitectónico, las empresas deben mantener la flexibilidad en la creación e implementación de agentes, ya sea mediante servicios nativos de hiperescaladores, proveedores de modelos líderes o modelos alojados en la empresa optimizados para el costo y la sensibilidad de los datos.
La IA con agentes puede generar el mayor valor en cinco áreas.
Las organizaciones que adaptan con éxito su infraestructura a la IA con agentes se centran en un conjunto de dominios de alto valor donde la automatización, la simplificación y el rediseño del modelo operativo pueden generar un impacto a corto plazo. Estas cinco áreas destacan: mesa de ayuda, observabilidad y gestión de servicios de TI (ITSM), operaciones de red, operaciones de alojamiento y gestión activa de costos y contratos.
Mesa de ayuda
La mesa de ayuda es el área más grande y la que genera valor más rápidamente, representando entre el 20 y el 30 por ciento del gasto total en mano de obra de infraestructura. El alto volumen de tickets, los flujos de trabajo estandarizados y las rutas de resolución predecibles hacen que esta área sea especialmente idónea para la automatización mediante agentes.
Los agentes de IA pueden resolver de forma autónoma solicitudes rutinarias de alto volumen, como restablecimientos de contraseñas y desbloqueos de cuentas, a la vez que guían la recepción estructurada de tickets a través de interacciones de autoservicio. Los problemas más complejos pueden derivarse a agentes humanos bajo una gobernanza claramente definida. Los agentes también pueden atender solicitudes de servicio estándar, como el aprovisionamiento de acceso, la asignación de licencias y los cambios de pertenencia a grupos, sin intervención manual. Las organizaciones pueden obtener ahorros de entre el 25 % y el 45 %, además de mejorar el cumplimiento de los acuerdos de nivel de servicio, ofrecer soporte permanente y optimizar la experiencia de los empleados.
Por ejemplo, el servicio de asistencia de TI de una multinacional integró agentes en todo su modelo de soporte con el objetivo de aumentar la productividad, mejorar la experiencia del usuario y reducir los tiempos de resolución de aproximadamente 450 000 tickets anuales. La organización rediseñó los recorridos del cliente y los flujos de trabajo para permitir la resolución liderada por agentes, priorizando un bot de recepción de tickets con IA, un agente que utiliza tecnología de respuesta de voz interactiva y una capacidad de monitorización proactiva de la infraestructura. La transformación permitió automatizar hasta el 80 % de las solicitudes, reasignar el 50 % de la capacidad de los agentes de servicio a actividades de mayor valor y obtener una puntuación de satisfacción del cliente de 4,8 sobre 5.
Observabilidad y gestión de servicios de TI (ITSM)
La observabilidad, la ITSM y las operaciones de infraestructura (incluidas las operaciones de red y alojamiento) representan entre el 45 % y el 75 % del gasto total en mano de obra de infraestructura, lo que refleja tanto las actividades de ingeniería de plataforma como las de respuesta operativa. Los ingenieros dedican una cantidad desproporcionada de tiempo a responder a alertas, así como a probar e implementar correcciones manualmente, lo que limita su capacidad para gestionar el riesgo de forma proactiva.
La IA con agentes automatiza tanto el diagnóstico como la resolución. Los agentes correlacionan continuamente registros, métricas, datos de configuración e historiales de cambios para identificar señales débiles, anomalías y patrones de fallos emergentes. Cuando se producen incidentes, los agentes proporcionan automáticamente el contexto relevante, identifican las causas raíz y ejecutan actividades de remediación predefinidas dentro de los límites establecidos. Los problemas comunes se pueden resolver de forma autónoma, mientras que los ingenieros intervienen selectivamente en los casos complejos. (Consulte el recuadro lateral «IA agente en acción: Respuesta a una alarma» para ver un ejemplo ilustrativo de este flujo de trabajo).
Operaciones de red
Las operaciones de red representan aproximadamente entre el 10 y el 20 por ciento del gasto total en mano de obra para infraestructura. Tradicionalmente, las redes empresariales se diseñaban para un tráfico relativamente estable.
Patrones de tráfico y resolución de problemas manual. Los equipos de red operan de forma reactiva, con una capacidad limitada para intervenir proactivamente antes de que surjan los problemas.
La IA con agentes permite una gestión en tiempo real basada en la intención. Los agentes pueden ingerir y correlacionar patrones de tráfico, estados de configuración, registros e historiales de cambios para detectar congestión, tráfico anómalo y riesgos emergentes, y traducir la intención de alto nivel en acciones de red controladas. Pueden priorizar de forma autónoma los eventos de red y ejecutar cambios rutinarios y repetitivos (como actualizaciones de firewall/VLAN) en respuesta a activadores de políticas. Al reducir el esfuerzo manual en la investigación y la ejecución, se pueden lograr ahorros del 20 al 40 por ciento en las implementaciones iniciales, con un potencial de automatización significativamente mayor a largo plazo.
Un ejemplo de esta transición a gran escala es la implementación de red con agentes de Deutsche Telekom, el «agente RAN Guardian». Operando en el contexto de eventos de red y situaciones excepcionales, los agentes supervisan activamente el rendimiento de la red móvil, ayudan a resolver problemas y optimizan las soluciones.
Operaciones de alojamiento
Las operaciones de alojamiento, que incluyen actividades locales, DevOps (desarrollo de software y operaciones de TI) y computación y almacenamiento en la nube, representan aproximadamente entre el 15 y el 25 por ciento del gasto total en mano de obra de infraestructura. Estas operaciones siguen estando dominadas por actividades repetitivas del ciclo de vida en la gestión de capacidad, la aplicación de parches y el aprovisionamiento de entornos, que aún se coordinan mediante tickets e intervención manual.
La IA con agentes transforma las operaciones de alojamiento hacia un control de entorno de ciclo cerrado. Los agentes pueden evaluar continuamente el estado del sistema, la desviación de la configuración y el cumplimiento de las políticas en entornos locales, DevOps y en la nube. Al estandarizar los entornos de ejecución, exponer las acciones del ciclo de vida mediante API e integrar las políticas como código, los agentes pueden gestionar de forma autónoma actividades rutinarias como el dimensionamiento adecuado y el mantenimiento de la capacidad en todos los entornos. Si se implementa correctamente, esto genera ahorros del 20 al 40 por ciento en las implementaciones iniciales, con un potencial de automatización significativamente mayor a largo plazo.
Por ejemplo, un proveedor líder de servicios públicos está modernizando sus operaciones de alojamiento mediante una combinación de automatización estándar y con agentes. Una evaluación integral reveló que varias áreas, como la gestión de capacidad, requerían mucha mano de obra y eran repetitivas. La organización implementó la infraestructura como código (IaC) para el aprovisionamiento y está introduciendo agentes de IA para analizar las compensaciones entre múltiples variables y coordinar flujos de trabajo interfuncionales. Como resultado, se identificó aproximadamente un 15 % de ahorros potenciales en la tasa de ejecución mediante IaC y un 20 % adicional mediante IA con agentes.
Gestión activa de costos y contratos
Una parte significativa del gasto en infraestructura, que suele representar entre el 40 % y el 60 % del gasto total en tecnología, está vinculada a servicios externos como la nube, el software y los contratos con proveedores. Este gasto se gestiona normalmente mediante revisiones periódicas. A medida que la IA se expande, los costos se vuelven más detallados, multidimensionales y no lineales, lo que requiere una gobernanza más estricta.
La IA con agentes traslada la optimización de costos de la revisión periódica a la gestión continua, lo que permite obtener ahorros de entre el 5 % y el 15 %. Los agentes pueden ingerir datos de uso en tiempo real, licencias, contratos y precios de referencia para optimizar automáticamente la infraestructura, recuperar licencias no utilizadas, aplicar límites presupuestarios e identificar configuraciones antieconómicas. Paralelamente, los agentes de compras pueden supervisar el rendimiento de los proveedores, comparar tarifas con datos históricos, validar facturas e identificar oportunidades de renegociación basadas en modelos de costes con la demanda real.
Agenda del CTO: Los primeros 90 días
Crear una infraestructura preparada para agentes no es una solución rápida, pero los primeros 90 días son cruciales para definir la dirección, demostrar su valor y generar credibilidad. Las acciones más importantes incluyen las siguientes:
• Rediseñar los procesos clave. Seleccionar un área con alto volumen de trabajo, problemas de rendimiento claros y un gran potencial para la ejecución repetible, como las operaciones de la mesa de ayuda y la gestión de incidentes. Desglosar el flujo de trabajo en sus tareas componentes y rediseñar el proceso para que las tareas rutinarias se ejecuten automáticamente dentro de límites definidos, mientras que los ingenieros intervienen cuando se requiere criterio o creatividad. Este rediseño suele simplificar el proceso en sí.
• Fortalecer los datos operativos. Los agentes no pueden compensar la inconsistencia de los registros del sistema ni la falta de claridad en la propiedad. Un punto de partida práctico es clarificar la fuente de información fidedigna para los activos, las configuraciones y las dependencias. Las convenciones de nomenclatura estándar, los esquemas consistentes y la propiedad explícita reducen la ambigüedad. Determine si los datos subyacentes y el conocimiento sobre la infraestructura están lo suficientemente estructurados y son lo suficientemente consistentes para que las máquinas puedan interpretarlos y reutilizarlos.
• Establezca prácticas sólidas de operación y gobernanza. Antes de que se permita a los agentes ejecutar cambios en entornos de producción, los CTO necesitan un marco claro que defina las acciones permitidas y los umbrales de escalamiento.
Responsabilidad y rendición de cuentas. Cada agente debe tener un propietario designado, con claridad sobre qué decisiones pueden tomarse de forma autónoma y cuáles requieren revisión. Las capacidades de registro y auditoría deben ser exhaustivas (véase el recuadro «El cambio en el modelo humano y operativo tras la infraestructura basada en agentes»).
• Implementar prácticas explícitas de gestión de agentes. Un registro formal que documente el propósito, el alcance y el rendimiento de cada agente evita la fragmentación. La gestión del ciclo de vida garantiza la retirada de los agentes obsoletos o redundantes. La visibilidad del rendimiento y el coste ayuda a la organización a comprender dónde se genera valor.
Seguiremos brindándote más información sobre este tema en las siguientes presentaciones físicas y digitales de Channel News Perú
Mantente conectado a nuestra plataforma de negocios y revista, haciendo clic aquí y suscribiéndote a nuestro newsletter para contenido de valor diario