Microsoft lanza Phi-2, un modelo de IA superior a Llama 2

Loading

Microsoft hizo oficial el lanzamiento de Phi-2. Se trata de un modelo de lenguaje pequeño (SLM, por sus siglas en inglés) basado en inteligencia artificial (IA) que promete superar en potencia y capacidades a desarrollos 25 veces más grandes, como Llama 2 de Meta.

El modelo cuenta con 2,700 millones de parámetros. En comparativa, el algoritmo más avanzado de la empresa liderada por Mark Zuckerberg opera con 70,000 valores. A pesar de la diferencia, Phi-2 demostró un rendimiento superior a Llama 2 en tareas matemáticas y de programación. El equipo de Microsoft afirma que las capacidades de razonamiento y comprensión de lenguaje del sistema marcan un nuevo hito entre los modelos base con menos de 13,000 millones de argumentos operativos.

Los desarrolladores atribuyen estos resultados a un proceso de entrenamiento más estratégico. Phi-2 fue instruido por 14 días a través de 96 tarjetas gráficas A100 de Nvidia. Los ingenieros utilizaron un conjunto de datos que incluyó documentos sintéticos de programación neurolingüística, información web seleccionada en función de su valor educativo, subconjuntos de código extraídos de Stack Overflow y una selección de libros de texto.

“Nuestra combinación de datos de entrenamiento contiene conjuntos de datos sintéticos creados específicamente para enseñar al modelo razonamiento con sentido común y conocimientos generales, incluida la ciencia, las actividades diarias y la teoría de la mente, entre otros”, detalló la empresa tecnológica.

El algoritmo no fue sometido a un proceso de refinamiento de respuestas por retroalimentación humana. Pese a esta condición, Microsoft afirma que el SML muestra un mejor comportamiento respecto a las respuestas tóxicas y sesgos de información, en comparación con Llama 2.

El modelo es de código abierto y está disponible solo para proyectos de investigación sin fines de lucro desde la suite Azure AI Studio. “Con su tamaño compacto, Phi-2 es un campo de juego ideal para los investigadores, incluso para la exploración en torno a la interpretabilidad mecanicista, mejoras de seguridad o experimentación de ajuste en una variedad de tareas”, señaló Microsoft.

La propuesta Phi de Microsoft y su impacto en el ambiente

El último lanzamiento de Microsoft es el tercer producto de un conjunto de SLM’s conocido como ‘Phi’. El proyecto pretende replicar el rendimiento de los grandes modelos de lenguaje de IA, pero con algoritmos más compactos, eficientes y estratégicos.

La propuesta empata con el principio que rige a los llamados algoritmos verdes. Estos desarrollos de IA se crean maximizando la eficiencia energética de las infraestructuras tecnológicas en las etapas de inferencia y capacitación. Están programados para operar con menos recursos y entregar resultados similares a los que ofrecen modelos más complejos. La intención es reducir la huella ambiental provocada por esta tecnología.

La Organización para la Cooperación y el Desarrollo Económicos estima que las grandes empresas tecnológicas destinan entre el 7 y 10% de su gasto total en infraestructura de cómputo en aplicaciones de IA. Entre un 3 y 4.5% se destina a entrenar modelos de aprendizaje automático, mientras que hasta un 4.5% está relacionado con poner en práctica lo aprendido. La Universidad de Massachusetts Amherst revela que el entrenamiento de un modelo IA genera las mismas emisiones que cinco autos durante todo su ciclo de vida.

(Wired.com)

Les estaremos informando con mucho más detalle, en el marco del informe especial: “Soluciones de infraestructura de Data centers y edge computing, componentes activos (UPS, AAC, generadores, tableros eléctricos, PDU) y pasivos (cables, gabinetes, pisos, accesorios, conectores) seguridad (perimétrica y de data) y controles (cámaras, extinguidores de gas, tableros de acceso). Buenas prácticas ambientales”, que estamos preparando para nuestra edición 207 y publicaremos en el mes de diciembre.

Mantente conectado a nuestra revista Channel News Perú, haciendo clic aquí y suscribiéndote a nuestro newsletter para contenido de valor diario.

Digiqole Ad

Notas Relacionadas