OpenAI lanza GPT-5-Codex, su nueva versión para Codex en 2025

OpenAI ha dado un importante paso en la evolución de sus herramientas de inteligencia artificial al anunciar el lanzamiento de una nueva versión de GPT-5, diseñada específicamente para su agente de codificación, Codex. Este nuevo modelo, denominado GPT-5-Codex, pretende optimizar la forma en que se aborda la resolución de problemas de programación, ofreciendo una mejora significativa en comparación con las versiones anteriores.

Mejoras en el rendimiento de GPT-5-Codex

El nuevo modelo se distingue por su capacidad de gestionar el "pensamiento" de manera más dinámica. A diferencia de anteriores versiones, GPT-5-Codex puede dedicar entre unos pocos segundos y hasta siete horas a resolver una tarea de codificación. Esta flexibilidad resulta en un mejor desempeño en las pruebas de codificación agentiva. OpenAI ha comenzado a integrar GPT-5-Codex en sus productos de Codex, accesibles a través de terminales, IDEs, GitHub y ChatGPT, y está disponible para usuarios de ChatGPT Plus, Pro, Business, Edu y Enterprise. La compañía también ha expresado sus intenciones de ofrecer este modelo a los clientes de API en un futuro cercano.

Contexto del mercado de herramientas de codificación con IA

El lanzamiento de GPT-5-Codex forma parte de la estrategia de OpenAI para aumentar la competitividad de Codex frente a otras soluciones de codificación asistida por inteligencia artificial, como Claude Code, Cursor de Anysphere y GitHub Copilot de Microsoft. En el último año, el mercado de herramientas de codificación basadas en IA se ha vuelto cada vez más concurrido, impulsado por una demanda intensa de usuarios. Por ejemplo, Cursor logró superar los 500 millones de dólares en ingresos recurrentes anuales a principios de 2025, mientras que Windsurf, un editor de código similar, estuvo envuelto en un intento de adquisición caótico que llevó a que su equipo se dividiera entre Google y Cognition.

Evaluaciones y capacidades mejoradas

Según OpenAI, GPT-5-Codex supera a GPT-5 en el benchmark SWE-bench Verified, que mide las habilidades de codificación de un agente, así como en las pruebas de refactorización de código en repositorios grandes y consolidados. Para perfeccionar sus capacidades, el modelo fue entrenado específicamente para realizar revisiones de código, y se solicitó a ingenieros de software experimentados que evaluaran los comentarios generados por el modelo. Los resultados de estas evaluaciones indican que GPT-5-Codex ofrece menos comentarios incorrectos y proporciona más "comentarios de alto impacto".

Funcionalidad dinámica del modelo

Alexander Embiricos, líder de producto de Codex en OpenAI, destacó que gran parte del aumento en el rendimiento de GPT-5-Codex se atribuye a sus habilidades de "pensamiento dinámico." Los usuarios podrían estar familiarizados con el router de GPT-5 utilizado en ChatGPT, que dirige las consultas a diferentes modelos según la complejidad de la tarea. Sin embargo, Embiricos explicó que GPT-5-Codex funciona de manera diferente, ya que no tiene un router interno y puede ajustarse en tiempo real sobre cuánto tiempo dedicar a una tarea. Por ejemplo, el modelo puede determinar cinco minutos después de iniciar un problema que necesita dedicar una hora extra, y en algunos casos se ha observado que toma más de siete horas en total para resolver ciertos desafíos.

Implicaciones para el futuro

El lanzamiento de GPT-5-Codex subraya el compromiso de OpenAI por avanzar en el ámbito de la inteligencia artificial aplicada a la codificación. Esta nueva versión no solo mejora la eficiencia y eficacia del código generado, sino que también establece nuevos estándares en la evaluación de herramientas de codificación asistida. A medida que el mercado continúa evolucionando, se espera que la competencia fomente aún más la innovación, beneficiando a desarrolladores y empresas involucradas en el desarrollo de software.

Para los interesados en esta evolución tecnológica y sus aplicaciones, se recomienda seguir de cerca las futuras actualizaciones y comparativas de rendimiento en este dinámico campo. Para más información y artículos sobre temas similares, se invita a los lectores a visitar este blog.