La IA está aprendiendo a optimizar chips, y eso pone en peligro a la propia Nvidia
![]()
Nvidia es la reina indiscutible de los chips de inteligencia artificial. Hasta ahora. Gracias a la IA que ayudó a construir, la campeona podría enfrentarse pronto a una competencia feroz y cada vez mayor.
La IA moderna funciona con diseños de Nvidia, una dinámica que ha impulsado a la empresa hasta una capitalización de mercado de más de 4 billones de dólares. Cada nueva generación de chips de Nvidia permite a las empresas entrenar modelos de IA más potentes utilizando cientos o miles de procesadores conectados en red dentro de enormes centros de datos. Una de las razones del éxito de Nvidia es que proporciona software para ayudar a programar cada nueva generación de chips. Puede que dentro de poco eso ya no sea una habilidad tan diferenciada.
Una startup llamada Wafer está entrenando modelos de IA para realizar una de las tareas más difíciles e importantes de la IA: optimizar el código para que se ejecute de la forma más eficiente posible en un chip de silicio concreto.
Emilio Andere, cofundador y consejero delegado de Wafer, asegura que la empresa realiza aprendizaje por refuerzo en modelos de código abierto para enseñarles a escribir código de núcleo, o software que interactúa directamente con el hardware en un sistema operativo. Andere afirma que Wafer también añade «arneses agénticos» a modelos de codificación existentes como Claude, de Anthropic, y GPT, de OpenAI, para aumentar su capacidad de escribir código que se ejecute directamente en los chips.
Muchas empresas tecnológicas importantes tienen ahora sus propios chips
Apple y otras compañías llevan años utilizando silicio personalizado para mejorar el rendimiento y la eficiencia del software que se ejecuta en laptops, tablets y teléfonos inteligentes. En el otro extremo de la escala, empresas como Google y Amazon acuñan su propio silicio para mejorar el rendimiento de sus plataformas de computación en la nube. Meta anunció recientemente que desplegaría 1 gigavatio de capacidad de computación con un nuevo chip desarrollado con Broadcom. Desplegar silicio personalizado también implica escribir mucho código para que se ejecute con fluidez y eficacia en el nuevo procesador.
Wafer está trabajando con empresas como AMD y Amazon para ayudar a optimizar el software de modo que funcione eficientemente en su hardware. Hasta la fecha, la empresa ha obtenido 4 millones de dólares de financiación inicial de Jeff Dean, de Google, Wojciech Zaremba, de OpenAI, y otros.
Andere cree que el enfoque de su empresa basado en la IA tiene potencial para desafiar el dominio de Nvidia. En la actualidad, varios chips de gama alta ofrecen un rendimiento bruto en coma flotante (una referencia clave del sector para medir la capacidad de un chip para realizar cálculos sencillos) similar al del mejor silicio de Nvidia.
«El mejor hardware de AMD, el mejor hardware Trainium [de Amazon], las mejores TPU [de Google], te dan los mismos flops teóricos que las GPU de Nvidia», me explicó Andere hace poco. «Queremos maximizar la inteligencia por vatio».
Los ingenieros de rendimiento con la habilidad necesaria para optimizar el código para que se ejecute de forma fiable y eficiente en estos chips son caros y están muy demandados, señala Andere, mientras que el ecosistema de software de Nvidia hace que sea más fácil escribir y mantener el código para sus chips. Esto dificulta que incluso las mayores empresas tecnológicas trabajen por su cuenta.
Cuando Anthropic se asoció con Amazon para construir sus modelos de IA en Trainium, por ejemplo, tuvo que reescribir el código de su modelo desde cero para que funcionara de la forma más eficiente posible en el hardware, afirma Andere.
Por supuesto, Claude de Anthropic es uno de los muchos modelos de IA que ahora son sobrehumanos escribiendo código. Así que Andere considera que no pasará mucho tiempo antes de que la IA empiece a consumir la ventaja del software de Nvidia.
“La ventaja competitiva reside en la programabilidad del chip”, aclara Andere, refiriéndose a las bibliotecas y herramientas de software que facilitan la optimización del código para el hardware de Nvidia. “Creo que es hora de replantearse si realmente se trata de una ventaja competitiva sólida”.
Lo que todo el mundo necesita: más chips
Además de facilitar la optimización de código para distintos tipos de silicio, la IA pronto podría facilitar el diseño de los propios chips. Ricursive Intelligence, una startup fundada por dos ex ingenieras de Google, Azalia Mirhoseini y Anna Goldie, está desarrollando nuevas formas de diseñar chips informáticos con inteligencia artificial. Si su tecnología despega, muchas más empresas podrían dedicarse al diseño de chips, creando silicio personalizado que ejecute su software de forma más eficiente.
“Nos centramos en los aspectos fundamentales del diseño de chips: el diseño físico y la verificación del diseño”, refiere Mirhoseini, quien también es profesor asistente en la Universidad de Stanford, en referencia a dos de los principales desafíos relacionados con el diseño de chips.
El diseño de chips informáticos es uno de los trabajos más importantes, y complejos, del mundo. Los ingenieros de chips deben encontrar la manera de organizar una gran cantidad de componentes en un chip de silicio para optimizar sus diferentes funciones. Tras el diseño inicial de un chip, su rendimiento debe someterse a pruebas y verificaciones exhaustivas mediante un proceso iterativo antes de enviarlo a la fundición.
Los diseños de Nvidia son cruciales para la IA moderna, ya que cada nueva generación de chips permite a las empresas entrenar modelos de IA más potentes utilizando cientos o miles de procesadores interconectados dentro de vastos centros de datos.
Durante su etapa en Google, Mirhoseini y Goldie desarrollaron un método para que la IA optimizara la disposición de los componentes clave de los chips informáticos. Este enfoque transformó la forma en que Google diseña sus propios procesadores y ahora se utiliza ampliamente en la industria para ayudar a organizar las funciones en diferentes chips.
Ricursive pretende ir más allá, automatizando más elementos del diseño de chips e integrando modelos de lenguaje complejos en el proceso. El objetivo es permitir que los ingenieros utilicen el lenguaje natural para describir cambios o formular preguntas sobre un chip. Del mismo modo que se puede programar una aplicación mediante la técnica de vibecode, quizás en el futuro sea posible diseñar un chip de esta manera.
Ricursive aún está desarrollando su tecnología, pero Mirhoseini sostiene que la empresa ya ha demostrado que puede optimizar más aspectos del diseño de chips.
La posibilidad de automatizar el diseño de chips de esta manera tiene a algunos inversores entusiasmados: Ricursive ha recaudado 335 millones de dólares con una valoración de 4,000 millones de dólares en tan solo unos meses.
Goldie manifiesta que, en última instancia, podría ser posible que la IA participe en el codiseño de chips y algoritmos para hacerlos más potentes. Explica que el hecho de que la IA optimice su propio silicio y código podría generar una mejora recursiva. «Nos adentramos en un nuevo paradigma donde podemos invertir más capacidad de procesamiento para diseñar chips más rápidos y mejores, creando así una especie de ley de escalado para el diseño de chips».
(wired.com)
Seguiremos brindándote más información sobre este tema en las siguientes presentaciones físicas y digitales de Channel News Perú
Mantente conectado a nuestra plataforma de negocios y revista, haciendo clic aquí y suscribiéndote a nuestro newsletter para contenido de valor diario