Metadatos: su valor oculto y los riesgos de una mala gestión en tiempos de nube e IA
Las empresas están comprendiendo que cada vez es más importante entender y saber manejar lo que está detrás de los datos: los metadatos. Pueden considerarse como el «ADN de los datos», según la definición de Carlos Coneglian, CEO de CyberStorage. Son ellos los que proporcionan contexto, origen, ciclo de vida y reglas de uso, elementos fundamentales para garantizar seguridad, gobernanza, interoperabilidad e inteligencia operativa.
En otra analogía, Anderson Miguel, arquitecto de soluciones de datos en GFT Technologies, explica que funcionan como el “sistema nervioso” de cualquier arquitectura de datos moderna. Describen los datos y son la base para la catalogación, trazabilidad (linaje de datos), cumplimiento normativo y automatización de políticas de seguridad y gobernanza.
Según Cesar Gomes Gonçalves, vicepresidente de Cloudera para Brasil, “los metadatos son los detalles pertinentes y prácticos sobre los activos de datos: qué son, para qué sirven, con qué deben utilizarse, cómo están siendo usados, dónde están, cuándo fueron creados y actualizados por última vez, si son confiables, etc».
El protagonismo de los metadatos en tiempos de nube e IA
No es casual que los metadatos hayan ganado importancia en la era de la nube y la inteligencia artificial. Dejaron de ser solo documentación técnica: ahora son la base de ecosistemas de datos e IA confiables y escalables. Desempeñan un papel esencial para garantizar transparencia, trazabilidad y cumplimiento normativo en el uso de modelos de IA en entornos en la nube.
En este contexto, Kevin Cochrane, Chief Marketing Officer de Vultr, considera que son “la columna vertebral” que permite documentar y comprender todo el ciclo de vida de un modelo de inteligencia artificial — desde el origen y las características de los datos utilizados, pasando por los parámetros de entrenamiento y versiones del modelo, hasta los contextos de su implementación.
“Hoy, los metadatos no solo describen los datos — los gobiernan, protegen y habilitan. La aparición de modelos como data fabric, data mesh y entornos zero-trust consolidó a los metadatos como el componente más estratégico de la arquitectura de datos moderna”, afirma Carlos Coneglian.
Gartner prevé que, para 2027, las organizaciones que adopten prácticas proactivas de gestión de metadatos reducirán en hasta un 70?% el tiempo de entrega de nuevos activos de datos.
“Gracias a una gestión adecuada de los metadatos, las organizaciones pueden auditar cómo y por qué un modelo tomó determinada decisión, identificar posibles sesgos o desviaciones y garantizar que los modelos cumplan con los estándares éticos y normativos. Esto es especialmente importante en sectores sensibles o altamente regulados, como el financiero, el de salud y el sector público”, explica Kevin Cochrane.
En entornos híbridos y distribuidos, la gestión de metadatos también es indispensable para garantizar la soberanía de la información.
“En el sector público brasileño, por ejemplo, el Gabinete de Seguridad Institucional de la Presidencia de la República (GSI), mediante una instrucción normativa de 2021, establece que, para utilizar soluciones de computación en la nube, no solo los datos, sino también los metadatos deben almacenarse obligatoriamente en territorio nacional. Esta exigencia refuerza la importancia de los metadatos como elemento de soberanía informacional, asegurando que el gobierno mantenga control y gobernanza sobre información estratégica”, comenta Rafael Oneda, director de Tecnología de Approach.
Los riesgos de ignorar los metadatos
Una investigación realizada por Oomnitza en 2024 reveló que aproximadamente el 46?% de las empresas enfrentaron un aumento significativo (del 10?% o más) en los costos y retrasos de auditorías debido a la mala calidad de los datos del inventario tecnológico. Además, el 47?% de las organizaciones gastaron al menos un 10?% más de lo presupuestado para auditorías debido a datos imprecisos y a la falta de automatización en los procesos. Las empresas con entre 1.000 y 5.000 empleados fueron un 27?% más propensas a experimentar ese aumento en costos y retrasos.
“Operativamente, la falta de una gestión adecuada dificulta el rastreo, la consistencia y la interoperabilidad entre sistemas. Legalmente, aumenta el riesgo de incumplimiento de las normativas de privacidad y protección de datos. Estratégicamente, impide la generación de valor a partir de los datos, perjudicando la innovación y la competitividad. Sin metadatos bien definidos, la confiabilidad de la información queda comprometida”, resalta Eduardo Terzariol, Director de Cloud y Data Analytics en Logicalis Brasil.
El uso inadecuado de los metadatos puede provocar problemas como la creación de silos de datos y una baja calidad de la información, lo cual afecta directamente la visibilidad sobre el linaje de los datos y, en consecuencia, conduce a análisis imprecisos y decisiones poco confiables. “Estratégicamente, esa falta de confianza puede ralentizar la innovación y dificultar la adopción de iniciativas de IA y análisis avanzados”, alerta Cesar Gomes Gonçalves.
“Una gestión deficiente impide una visión holística de los datos, afecta la confiabilidad de la información y compromete iniciativas de IA, BI (Business Intelligence) y automatización, haciendo la solución menos competitiva y confiable”, añade Anderson Miguel.
Un estudio de IDC señala que los incidentes relacionados con la mala gestión de datos generan pérdidas de hasta 3,1 billones de dólares al año solo en el mercado norteamericano, afectando gravemente la reputación, la confianza del mercado y los resultados financieros de las empresas.
“En sectores regulados o en el ámbito gubernamental, el riesgo es aún más crítico: el incumplimiento de requisitos como el almacenamiento adecuado de los metadatos puede comprometer la soberanía de la información, generar sanciones regulatorias severas y afectar la confianza pública”, dice Rafael Oneda.
El principal desafío está en manejar arquitecturas distribuidas: “En entornos on-premise y en la nube, la complejidad operativa aumenta. Aun así, el modelo híbrido es el más adoptado por ofrecer flexibilidad. El gran reto es mantener el entorno centralizado en términos de gobernanza: con datos clasificados, controlados y con acceso jerarquizado”, observa Thiago Spósito, socio de Add Value.
Un ejemplo del efecto práctico de la gestión de metadatos viene de Healthesystems, un proveedor de gestión de beneficios farmacéuticos y auxiliares. La organización enfrentaba una creciente complejidad en su ecosistema de datos, con pipelines distribuidos en diversas herramientas y plataformas. “Entender el linaje de los datos, rastrear cambios y mantener el cumplimiento era algo lento y propenso a errores — a menudo llevaba días o incluso semanas completar una sola tarea”, destaca Cesar Gomes Gonçalves.
Healthesystems implementó una solución de inteligencia orientada por metadatos, que centralizó esta información y proporcionó visibilidad total de su entorno de datos. Esto permitió a sus equipos rastrear instantáneamente el linaje, comprender dependencias y realizar cambios con confianza.
Como resultado, la empresa redujo en más de un 80% el tiempo dedicado a tareas relacionadas con datos, además de lograr mejoras significativas en accesibilidad, calidad y cumplimiento normativo. “Tareas como identificar el impacto de un cambio en el esquema, que antes tomaban días, ahora pueden realizarse en minutos, liberando al equipo para enfocarse en iniciativas de mayor valor”, completa Cesar.
¿Y cómo debemos gestionar los metadatos?
Thiago Spósito deja claro el punto de partida: “Muchas empresas aún no han clasificado adecuadamente sus datos — lo que impide la creación de políticas eficaces de respaldo, seguridad y uso. Independientemente del tipo de dato, el primer paso es siempre entender el volumen, clasificarlo y, a partir de ahí, establecer políticas. Con la diversidad y el volumen actual de datos, la ausencia de soluciones como tracking y DLP (Data Loss Prevention) expone a las organizaciones a riesgos. También es fundamental definir niveles de acceso, garantizando que solo quienes lo necesitan tengan visibilidad sobre determinados datos”.
Sin embargo, la mayoría de las empresas aún están lejos de implementar capacidades avanzadas en la gestión de metadatos. Se estima que solo entre el 5% y el 20% de las organizaciones están automatizando este proceso, y menos del 5% añadiendo inteligencia a esta función.
La tendencia, sin embargo, es hacia una creciente concienciación sobre estos cuidados:
“Muchos de nuestros clientes están priorizando los metadatos como eje central de sus estrategias de gobernanza de datos y nube híbrida. Vemos un aumento en la inversión en catálogos de datos, herramientas de linaje y soluciones automatizadas de gobernanza. Los clientes también están formando equipos dedicados a la gobernanza de datos, enfocados en maximizar el valor de los datos mientras garantizan el cumplimiento”, informa Cesar Gomes Gonçalves.
Estos son los pilares de una buena estrategia de gestión de metadatos en entornos híbridos, según Carlos Coneglian, CEO de CyberStorage:
- Catalogación inteligente y continua, con descubrimiento automatizado de activos de datos.
- Gobernanza federada, con políticas unificadas pero flexibles para múltiples fuentes.
- Seguridad integrada y auditable, garantizando acceso basado en perfil y trazabilidad completa.
- Interoperabilidad con ecosistemas diversos, soportando APIs abiertas e integración con herramientas de respaldo, análisis, IA y cumplimiento.
- Inmutabilidad y trazabilidad de bloques, algo que ofrecemos como diferencial a través de una arquitectura descentralizada y cifrada.
La gestión adecuada de los metadatos fue determinante para el éxito del proceso por el cual pasó Algar en marzo del año pasado, con la implementación de un sistema de hiperautomatización con el uso de IA generativa y RPA (automatización robótica de procesos) para revolucionar la gestión del ciclo de ingresos de la empresa.
“Tener la información organizada y estructurada con gobernanza y seguridad fue fundamental para poder desarrollar el proyecto y tener éxito en su ejecución en producción. Logicalis realizó una consultoría previa sobre el entorno de datos de Algar y con eso pudo prepararse para que el entorno cumpliera con este proyecto”, cuenta Eduardo Terzariol, Director de Cloud y Data Analytics de Logicalis Brasil.
El proyecto impactó positivamente los segmentos corporativo y mayorista al reducir el tiempo de análisis de facturas en un 96%, pasando de 31 minutos a solo un minuto por factura. En los primeros meses, se generaron 350.000 dólares en ahorros de OpEx (gastos operativos de la organización).
Como evidencian los casos de uso, una buena gestión de los metadatos se ha convertido en una necesidad estratégica, no solo para evitar riesgos legales y de cumplimiento, sino también para garantizar eficiencia operativa, apoyar la toma de decisiones asertivas y fortalecer la competitividad de las empresas al explorar todo el potencial de la nube y la inteligencia artificial.
(datacenterdynamics.com)
Les estaremos informando con mucho más detalle, en el marco del informe especial: “Soluciones y productos de infraestructura para edificios y ciudades inteligentes (Sistemas BIM y BMS), POL (Passive Optical LAN). Seguridad integrada, video vigilancia y control de acceso. Casos de uso y aplicabilidad de cada solución y producto, incluyendo la colaboración digital (relacionado a realidad virtual sistema BIM) (Gemelos digitales). Buenas prácticas ambientales.», que estamos preparando para nuestra edición 216 y publicaremos en el mes de julio.
Mantente conectado a nuestra revista Channel News Perú, haciendo clic aquí y suscribiéndote a nuestro newsletter para contenido de valor diario.
