¿Son los tokens la única métrica de los centros de datos que importa en la era de la IA?

4.664 Visitas Totales , 4.664 Visitas Hoy

Al mundo empresarial le encantan las métricas. Un único número capaz de contar una historia de forma rápida y sencilla, aunque en el proceso se puedan perder el contexto y los matices.

Durante años, el sector de los centros de datos se centró en el PUE, una cifra sencilla que indicaba la eficiencia con la que funcionaba un centro de datos. Resultó muy útil para el sector y permitió a los operadores mostrar rápidamente al mundo lo mucho que había mejorado.

Pero a medida que avanzamos hacia un mundo de refrigeración líquida e inteligencia artificial, en el que la mejora del PUE se está ralentizando, ¿es la eficiencia simbólica el único indicador válido para las empresas centradas en la inteligencia artificial?

¿El fin del PUE?

La eficacia en el uso de la energía (PUE), que durante mucho tiempo ha sido la métrica de referencia para la eficiencia de los centros de datos, tiene sus inconvenientes, pero siempre ha sido una forma sencilla para que el sector mostrara sus avances.

Desde que fue propuesta por primera vez por Christian Belady y Chris Malone y promovida por The Green Grid en 2006, la media del sector en cuanto al PUE ha descendido de alrededor de 2,5 en 2007 a menos de 1,4 en la actualidad. En el caso de las nuevas instalaciones con refrigeración líquida y las de hiperescala, se suele afirmar que los valores de PUE se sitúan en 1,1 o incluso por debajo.

Es un indicador popular porque es fácil de calcular —simplemente es la relación entre la potencia total de la instalación y la potencia consumida por la carga informática— y ofrece una métrica única y sencilla que pueden entender fácilmente las personas sin conocimientos técnicos.

Sin embargo, ya quedan pocos márgenes de mejora en cuanto al PUE para cualquier instalación de nueva construcción. Es probable que cualquier nueva instalación que utilice refrigeración líquida se sitúe en torno a la marca de 1,1. Y la eficacia en el uso de la potencia total (TUE), una métrica diseñada para medir mejor la eficiencia energética de los centros de datos, aún no ha terminado de despegar como un indicador significativo a gran escala.

La siguiente gran métrica en la que se centró el sector fue la eficacia en el uso del agua (WUE), una forma de que los centros de datos midan su eficiencia hídrica. Se mide en metros cúbicos de agua por megavatio-hora de energía (m³/MWh) y compara el agua utilizada para la refrigeración con la energía consumida por los equipos informáticos.

A medida que el consumo de agua se fue convirtiendo en un tema cada vez más importante dentro del sector —impulsado en parte por el cambio climático, pero sobre todo como una forma de demostrar su compromiso con la sostenibilidad ante la presión de los residentes y las autoridades—, la WUE puso de relieve el elevado consumo de agua que pueden tener las instalaciones en climas secos que dependen de la refrigeración por evaporación. Las mejoras en este ámbito siguen en marcha, pero a menudo se ven obstaculizadas por decisiones de diseño tomadas hace años.

Sin embargo, los sistemas de circuito cerrado completo solo requieren una inyección única de agua, ya que el fluido circula continuamente y se reutiliza. En teoría, estos sistemas tienen un WUE casi nulo. Aunque no son el estándar del sector, estos diseños de circuito cerrado —o, en definitiva, sin agua— se están volviendo mucho más habituales, ya que los operadores buscan que sus nuevos proyectos superen el proceso de planificación en un contexto de mayor escrutinio.

Entonces, ¿cuál es el siguiente indicador que importa?

¿Es hora de los tokens?

En medio del auge de la IA y de una menor atención a la sostenibilidad en una época de populismo de derechas, ¿está a punto de surgir una nueva métrica, excesivamente simplista, en la que el sector de los centros de datos deba centrarse? Entran en escena los tokens.

Durante un evento celebrado recientemente en Buffalo, Nueva York, los directivos de Schneider Electric mencionaron los tokens en numerosas ocasiones, destacando cómo los hiperescaladores, los «neoclouds» y cualquier empresa u operador que desee implementar hardware de IA de gama alta se centran en sacar el máximo partido a sus GPU en términos de tokens por vatio y/o dólar.

En la jerga de la IA, los tokens son pequeñas unidades de datos que pueden ser procesadas por modelos como ChatGPT o Claude. Estos modelos de transformador toman entradas como texto, imágenes, audio o vídeo, y desglosan esos datos en tokens para su procesamiento, tanto para el entrenamiento como para la inferencia. Cuanto más rápido se puedan procesar los tokens, más rápido podrán aprender y responder los modelos.

Cuando los modelos en entrenamiento alcanzan miles de millones o billones de tokens y hay millones de clientes realizando solicitudes de inferencia, la eficiencia de los tokens puede tener un gran impacto en el tiempo y el coste (y la energía) necesarios para entrenar un modelo o procesar un gran número de solicitudes.

Nvidia suele hablar del coste de los tokens y de las mejoras en la eficiencia cuando promociona su hardware más reciente. Las empresas de IA suelen cobrar por token, por lo que una mayor eficiencia de los tokens se traduce en mejores márgenes en todas esas costosas GPU y en la capacidad de los centros de datos que las acompaña.

Los tokens se han convertido en la forma abreviada de expresar la eficacia con la que los modelos y el hardware que los ejecuta generan beneficios para sus propietarios. A la gente le encantan las métricas sencillas, y «mejor eficiencia de tokens = más dinero» es tan sencillo como puede ser.

¿Se han agotado el PUE y el WUE?

Durante la presentación, Schneider destacó la importancia de los tokens por vatio como métrica (tokens divididos por vatios consumidos, siendo mejores los valores más altos), así como del coste por token (coste total de computación, energía, etc., dividido por el número de tokens producidos; cuanto menor, mejor).

Aunque una mejor cifra de tokens por vatio significa que un operador, como mínimo, está gestionando su hardware y software de forma eficiente, no tiene en cuenta muchos otros factores. Un centro de datos con una buena puntuación de tokens por vatio que se alimente de gas natural barato puede parecer bueno sobre el papel, pero no es precisamente respetuoso con el medio ambiente.

Sin embargo, a medida que el sector ve cada vez menos margen de mejora en indicadores como el PUE y el WUE, la eficiencia en la generación de tokens podría ser lo único que queda donde las empresas puedan obtener beneficios significativos.

Durante su presentación, Schneider también expuso las puntuaciones de PUE y WUE para dos centros de datos teóricos situados en Dallas (Texas) y París (Francia), destacando las diferencias en función de si se utiliza refrigeración por aire o por líquido, y de si los sistemas de agua son de circuito abierto o cerrado.

En todos los escenarios, el PUE de estas nuevas construcciones teóricas sería de 1,15 o inferior, y en la mayoría de los casos inferior a 1,1. Por su parte, las puntuaciones de WUE de las instalaciones con refrigeración líquida de circuito cerrado serían prácticamente nulas, ya que solo es necesario rellenarlas una vez y el agua se sustituye muy ocasionalmente.

En el mundo real, hay muchas más variables, pero en el escenario teórico de Schneider, la adopción de la refrigeración líquida y de los sistemas de agua de circuito cerrado en los equipos más eficientes energéticamente significa que la única métrica que realmente varió de forma significativa es la eficiencia de los tokens, que osciló considerablemente en los distintos escenarios. Y si los tokens equivalen a dólares, esa es la métrica en la que se centrarán muchos operadores a la hora de construir instalaciones.

«No creo que nadie lo haya intentado», afirma Manish Kumar, vicepresidente ejecutivo de Schneider Electric para energía segura y centros de datos, a DCD cuando se le pregunta sobre la necesidad de una métrica sencilla que combine los «tokens» con la sostenibilidad. «De hecho, lo estamos analizando en profundidad; es algo que debemos tener en cuenta».

Kumar señala que probablemente se ha producido un «cambio de discurso», ya que el mundo empresarial está prestando menos atención a la sostenibilidad y centrándose más en los tokens.

«Cuanto más se reduzca el número de tokens por vatio, más competitiva se vuelve la empresa», afirma. «Así que quizá no se analice únicamente desde el punto de vista de la sostenibilidad, sino también desde el de la economía pura y la competitividad».

No obstante, señala que la empresa «sigue considerando» que la eficiencia energética es importante en los centros de datos, dada la cantidad de electricidad que estos van a consumir.

«No sé en qué punto nos quedaremos. Los tokens por dólar seguirán siendo un área prioritaria, pero tarde o temprano [surgirá algo]».

Las cifras aumentan

Aunque es importante comprender la eficiencia de los tokens, no debería ser lo único que importe.

Algunas empresas están presionando a sus empleados para que gasten tantos tokens como sea posible —lo que se conoce como «tokenmaxxing»— con el objetivo de que el personal se familiarice con los sistemas y quizá descubra algún valor real, o simplemente para demostrar que forman parte del auge de la IA, independientemente del beneficio real. Esto último —ejemplos reales del meme «las cifras crecen»— se está llevando a cabo a cambio de dólares en muchas de las empresas más grandes del mundo.

El director ejecutivo de Nvidia, Jensen Huang, ya ha expresado en otras ocasiones su profunda preocupación si los ingenieros no consumen regularmente tokens por valor de miles de dólares al año.

Algunos informes sugieren que los empleados de grandes empresas como Amazon y Meta están inflando activamente el consumo de tokens de IA en tareas innecesarias para alcanzar los objetivos de uso internos y aparecer en posiciones más altas en las clasificaciones internas. DCD ha tenido conocimiento de que los trabajadores del conocimiento de empresas más pequeñas utilizan sistemas de IA para realizar tareas empresariales «importantes», como consultar itinerarios de tren y generar imágenes de sus mascotas, con el fin de ayudar a mantener las puntuaciones en las clasificaciones tal y como desea la dirección.

A pesar de que la empresa es una gran usuaria de IA, el presidente y director de operaciones de Uber, Andrew Macdonald, advirtió recientemente de que el gigante del taxi aún no ha encontrado una relación entre un mayor uso de tokens de IA y un aumento de las funciones útiles para los consumidores. Esto ocurrió pocos días después de que el director técnico de Uber, Praveen Neppalli Naga, afirmara que los ingenieros de la empresa ya se habían gastado en abril todo el presupuesto de Claude Code asignado para 2026.

Según se informa, la empresa de software ServiceNow también ha agotado su asignación presupuestaria anual para Claude en menos de cinco meses. Una buena noticia, quizás, para quienes cobran por token, pero no tanto para las empresas con restricciones presupuestarias, a menos que los precios bajen drásticamente.

La muerte del PUE se viene anunciando desde hace tiempo, pero este viejo indicador sigue en pie porque ofrece una visión sencilla y rápida. Aunque sin duda ayudó al sector a reflexionar sobre la eficiencia energética —y a mejorar en este aspecto—, hay quien sostiene que era demasiado simplista y conducía a una visión de túnel.

Las métricas basadas en tokens son igualmente sencillas. Y pueden vincularse de forma mucho más directa a los ingresos que el PUE. Es demasiado pronto para afirmarlo, pero esperemos que el enfoque en una eficiencia y una sostenibilidad más amplias no quede relegado a un segundo plano en una búsqueda con visión de túnel de unos rendimientos por token cada vez mejores y unos márgenes de beneficio más elevados.

La sostenibilidad en la era de la IA y las «neoclouds» ya ha sufrido suficientes reveses en los últimos tiempos. El sector aceptó rápidamente el gas natural como fuente de energía principal —quien diga que es un puente a corto plazo hacia el hidrógeno o la energía nuclear o bien miente o es excesivamente optimista— y circulan rumores de que algunos hiperescaladores podrían abandonar sus compromisos de neutralidad de carbono para 2030. No nos dejemos llevar por el exceso de entusiasmo a la hora de producir tokens infinitos de forma insostenible en la búsqueda a corto plazo del beneficio económico.

(datacenterdynamics.com)

Seguiremos brindándote más información sobre este tema en las siguientes presentaciones físicas y digitales de Channel News Perú

Mantente conectado a nuestra plataforma de negocios y revista, haciendo clic aquí y suscribiéndote a nuestro newsletter para contenido de valor diario

Digiqole Ad
...

Notas Relacionadas