DeepMind presenta una IA científica que ya diseña chips mejor que los humanos
Una cuestión clave en inteligencia artificial es con qué frecuencia los modelos van más allá de regurgitar y remezclar lo que han aprendido y producen ideas o conocimientos realmente novedosos.
Un nuevo proyecto de Google DeepMind demuestra que, con unos cuantos retoques inteligentes, estos modelos pueden al menos superar la experiencia humana en el diseño de ciertos tipos de algoritmos, incluidos los que son útiles para el avance de la propia IA.
El último proyecto de IA de la empresa, llamado AlphaEvolve, combina las habilidades de codificación de su modelo de IA Gemini con un método para probar la eficacia de nuevos algoritmos y un método evolutivo para producir nuevos diseños.
Problemas del mundo real
AlphaEvolve ideó algoritmos más eficaces para varios tipos de cálculo, incluido un método para cálculos con matrices que mejora el algoritmo de Strassen, utilizado desde hace 56 años. El nuevo enfoque mejora la eficiencia computacional al reducir el número de cálculos necesarios para producir un resultado.
DeepMind también utilizó AlphaEvolve para idear mejores algoritmos para varios problemas del mundo real, como la programación de tareas dentro de los centros de datos, el esbozo del diseño de chips informáticos y la optimización del diseño de los algoritmos utilizados para construir grandes modelos de lenguaje como el propio Gemini.
«Se trata de tres elementos críticos del ecosistema moderno de la IA», afirma Pushmeet Kohli, responsable de IA para la ciencia en DeepMind. «Este agente de codificación sobrehumano es capaz de asumir ciertas tareas e ir mucho más allá de lo que se conoce en cuanto a soluciones para ellas«.
Matej Balog, uno de los jefes de investigación de AlphaEvolve, señala que a menudo es difícil saber si un gran modelo de lenguaje ha dado con un escrito o código realmente novedoso, pero sí es posible demostrar que ninguna persona ha dado con una solución mejor a determinados problemas. «Hemos demostrado con mucha precisión que se puede descubrir algo que es probadamente nuevo y probadamente correcto», indica Balog. «Puedes estar realmente seguro de que lo que has encontrado no podría haber estado en los datos de entrenamiento».
Sanjeev Arora, científico de la Universidad de Princeton especializado en diseño de algoritmos, destaca que los avances de AlphaEvolve son relativamente pequeños y solo se aplican a algoritmos que implican buscar en un espacio de respuestas potenciales. Pero añade: «La búsqueda es una idea bastante general aplicable a muchos entornos».
La codificación basada en IA está empezando a cambiar la forma en que los desarrolladores y las empresas escriben software. Los últimos modelos de IA hacen que sea trivial para los principiantes crear aplicaciones y sitios web sencillos, y algunos desarrolladores experimentados están utilizando la IA para automatizar más su trabajo.
AlphaEvolve demuestra el potencial de la IA para generar ideas completamente nuevas a través de la experimentación y la evaluación continuas. DeepMind y otras empresas de IA esperan que los agentes de IA aprendan gradualmente a mostrar un ingenio más general en muchas áreas, quizá generando finalmente soluciones ingeniosas a un problema empresarial o ideas novedosas cuando se les plantee un problema concreto.
Josh Alman, profesor adjunto de la Universidad de Columbia que trabaja en el diseño de algoritmos, afirma que AlphaEvolve parece generar ideas novedosas en lugar de remezclar lo aprendido durante el entrenamiento. «Tiene que estar haciendo algo nuevo y no simplemente regurgitando», aclara.
Los investigadores de DeepMind descubrieron que a veces podían dar una idea para un algoritmo y producir nuevos resultados interesantes. Alman afirma que esto plantea la posibilidad de que científicos humanos puedan colaborar con un sistema como AlphaZero: «Me parece realmente emocionante».
Pero hay más
AlphaEvolve no es el único programa de DeepMind que demuestra verdadero ingenio. AlphaZero, el famoso programa de juegos de mesa de la empresa, fue capaz de idear jugadas y estrategias originales a través de su propia forma de experimentación. Balog declara que el enfoque evolutivo utilizado por su grupo podría combinarse con el método de aprendizaje por refuerzo empleado en AlphaZero (un proceso que permite a un programa aprender a través de comentarios positivos y negativos) para crear algo que explore nuevas ideas en otras áreas.
Dos proyectos anteriores de DeepMind también utilizaron la IA para ampliar los límites de la informática. AlphaTensor, de 2022, utilizó el método de aprendizaje por refuerzo para producir algoritmos novedosos. Fun Search, de 2024, usó un método evolutivo para generar código más eficiente para un problema dado.
Neil Thompson, científico del MIT que estudia el modo en que los algoritmos afectan al progreso tecnológico, afirma que una cuestión clave no es solo si los algoritmos de IA pueden exhibir ideas originales, sino en qué medida esto puede aplicarse en general a la investigación científica y la innovación.
«Si estas capacidades pueden utilizarse para abordar problemas de mayor envergadura y menos circunscritos, tienen el potencial de acelerar la innovación y, por tanto, la prosperidad», concluye Thompson.
(wired.com)
Les estaremos informando con mucho más detalle, en el marco del informe especial: “Arquitecturas de IA, Machine Learning, Deep Learning, Gemelos digitales y Soluciones de valor de Cloud Computing con innovadores modelos de negocio, soluciones de IOT, IOTI, soluciones de Automatización. Ciberseguridad, Infraestructura de conectividad: redes LAN, Wifi. Buenas prácticas corporativas.», que estamos preparando para nuestra edición 215 y publicaremos en el mes de junio.
Mantente conectado a nuestra revista Channel News Perú, haciendo clic aquí y suscribiéndote a nuestro newsletter para contenido de valor diario.
