OpenAI lanza el agente de IA Codex
OpenAI ha anunciado el lanzamiento de Codex, un agente de codificación de IA diseñado para ayudar a los ingenieros de software a escribir código, corregir errores y ejecutar pruebas.
Según explican fuentes de la empresa, Codex funciona con codex-1, una variante del modelo o3 de OpenAI optimizada para el desarrollo de software, y se ejecuta en un entorno aislado basado en la nube que se integra con GitHub.
Aunque está pensado para los usuarios de ChatGPT Pro, Enterprise y Team, OpenAI ha informado de que planea ampliar en breve el acceso a los usuarios de Plus y Edu.
Cisco o Temporal son algunas de las empresas que ya han comenzado a usarlo en funciones depuración y el desarrollo de funciones. Sin embargo, la duración de las tareas, que oscila entre 1 y 30 minutos, y los límites de uso previstos han empezado a plantear dudas acerca de la eficiencia del flujo de trabajo y la rentabilidad en comparación con los asistentes de codificación en tiempo real.
Mientras GitHub Copilot ofrece sugerencias online, el nuevo agente de OpenAI automatiza tareas de varios pasos. Por citar algunos ejemplos, Claude Code, de Anthropic, y Gemini Code Assist, de Google, se centran más en la colaboración IDE en tiempo real. Mientras, Cursor AI hace hincapié en comprender y explicar de manera clara y detallada cómo un modelo de IA realiza una tarea, como es el caso de una predicción o una decisión, por encima de la automatización. La reciente adquisición de Windsurf por parte de OpenAI subraya la intención de la compañía de ampliar las capacidades y el liderazgo de Codex en el mercado.
Nikhilesh Naik, director asociado de QKS Group, explica que “Codex cambia la forma en que los equipos de ingeniería abordan las tareas rutinarias”. A su juicio, “las empresas necesitarán menos programadores principiantes y más personas capaces de diseñar, coordinar e integrar software a gran escala”.
Integración de Codex
OpenIA ha dado a conocer a través de un comunicado de prensa que Codex sería capaz de gestionar múltiples tareas de programación a la vez (creación de funciones, depuración, redacción de pruebas) a través de la barra lateral de ChatGPT.
Así, los desarrolladores podrían asignar tareas o hacer preguntas a través de mensajes, y Codex seguiría las reglas del proyecto desde un archivo AGENTS.md para, a continuación, extraer información de los repositorios de GitHub para alinearse con las prácticas del equipo, según se puede leer en el comunicado. Por ejemplo, puede crear una función de inicio de sesión o explicar código complejo para, después, generar código y mostrar registros y resultados de pruebas para su revisión.
Se trata de un nivel de automatización que marca un cambio en las funciones de los desarrolladores. Las empresas deben considerarlos no sólo como autores de código, sino como “arquitectos cognitivos”, responsables de diseñar sistemas que los futuros mantenedores y auditores puedan comprender con más facilidad, según Naik.
No obstante, este especialista advierte de que el éxito de la integración depende de contar con bases de código estructuradas, pruebas definidas y tareas bien delimitadas. Su ausencia provocará que los equipos dediquen más tiempo a limpiar que a ahorrar. Eso le lleva a decir que “usarlo para flujos de trabajo de extremo a extremo a menudo conduce a resultados inconsistentes y regresiones”.
Precaución con las “funciones silenciosas”
Naik también advierte de que la mayor preocupación radica en los denominados “errores silenciosos”. O lo que es lo mismo: situaciones en las que el código generado por la IA parece correcto, pero bien compromete la modularidad, bien enmascara errores o los introduce de manera sutil. En este sentido, hace hincapié en la necesidad de establecer límites arquitectónicos claros, flujos de comandos de cuidado diseño y procesos de validación rigurosos antes y después de cada tarea para evitar confundir la velocidad con la fiabilidad.
OpenAI ha reconocido que sus ingenieros utilizan Codex para tareas rutinarias como la redacción de documentación. Si bien los primeros en adoptarlo, como Superhuman, permiten a personas sin conocimientos de programación modificar el código, la revisión humana sigue siendo esencial. La última versión de Codex CLI ofrecería un modelo más rápido para ediciones y consultas rápidas locales a un precio de 1,50 dólares por millón de tokens de entrada y 6 dólares por millón de tokens de salida a través de la API, según la empresa.
Qué significa para las empresas
“El auge de OpenAI Codex marca un cambio en la forma en que las empresas definen la productividad, el talento y el valor arquitectónico”, afirma Naik.
Según OpenAI, empresas como Kodiak.ai lo utilizan para herramientas de depuración, mientras que Temporal lo aplica para revisar grandes bases de código. El entorno aislado de Codex se caracteriza por bloquear el acceso a Internet y rechazar el código malicioso. Si viene esto satisface las necesidades de seguridad de las empresas, también puede limitar las tareas que requieren datos externos.
No obstante, el reto de los directores de informática y los directores de tecnología consiste en integrar Codex y también garantizar que los equipos conserven un profundo conocimiento de la ingeniería. Naik advierte de que la dependencia excesiva de estas herramientas podría fomentar una falsa sensación de experiencia. “Sin bucles de retroalimentación constantes (análisis inverso de prompts, revisiones arquitectónicas y depuración con intervención humana), Codex corre el riesgo de convertirse en un ejecutor sin control en lugar de ser una rampa de lanzamiento para el aprendizaje”, afirma.
¿Una nueva era para los desarrolladores?
La IA está transformando de una manera inusitada la forma en que se crea el software. El director ejecutivo de GitHub, Thomas Dohmke, ya predijo que la IA pronto escribirá el 80% del código nuevo. Google también destacó en su informe de resultados del tercer trimestre de 2024 que más de una cuarta parte de su código nuevo es generado por IA. Según Mark Zuckerberg, Meta está ampliando la adopción de la IA en todos sus equipos de ingeniería. Del mismo modo, muchas startups de Y Combinator aprovechan en gran medida los grandes modelos de lenguaje. Es en este escenario donde entra Codex, de OpenAI, con un enfoque centrado en las empresas y dirigido a la escala, la velocidad y la seguridad.
De todas formas, esto no está exento de riesgos. Un reciente estudio de Microsoft ha descubierto que incluso los mejores modelos pueden fallar en la depuración, lo que supone introducir vulnerabilidades en ocasiones. Aunque Codex promete ciclos más rápidos y mejores pruebas, sigue siendo fundamental lo que Naik denomina una supervisión cuidadosa como “barrera de seguridad”.
En definitiva, Codex cambia el papel del desarrollador, que pasa de escribir código a guiar sistemas inteligentes, delegar tareas y revisar resultados. Esto supone elevar y no reducir el juicio humano. Para Naik, “el riesgo no es que los desarrolladores dejen de programar, sino que dejen de entender lo que hace el código”.
De ahí que este especialista argumente que el reto clave de los responsables de TI consiste en equilibrar estas potentes herramientas con la necesidad de mantener las habilidades de resolución de problemas de los desarrolladores, mientras la IA se encarga de la codificación básica. También ha señalado que existe la amenaza inminente de la deuda técnica, que aparecería si los resultados no son revisados de una manera rigurosa. Algo que la propia OpenAI ha señalado, por lo que insta a la validación manual de todo el código generado por Codex.
Al final, no se trata de la rapidez con la que la IA puede producir código, sino de ejercitar la reflexión para trabajar con lo que la IA nos ofrece. Como dice Naik, “Codex debe despertar nuestros mejores instintos y juicios de ingeniería, no sustituirlos”.
Les estaremos informando con mucho más detalle, en el marco del informe especial: “Arquitecturas de IA, Machine Learning, Deep Learning, Gemelos digitales y Soluciones de valor de Cloud Computing con innovadores modelos de negocio, soluciones de IOT, IOTI, soluciones de Automatización. Ciberseguridad, Infraestructura de conectividad: redes LAN, Wifi. Buenas prácticas corporativas.», que estamos preparando para nuestra edición 215 y publicaremos en el mes de junio.
Mantente conectado a nuestra revista Channel News Perú, haciendo clic aquí y suscribiéndote a nuestro newsletter para contenido de valor diario.
