OpenAI lanzó GPT-5.1-Codex-Max y superó a Gemini 3 Pro en un día

OpenAI presentó GPT-5.1-Codex-Max. Esta es versión de GPT-5.1 Thinking, especialmente adaptada para tareas de programación dentro de agente de codificación Codex. Este es primer modelo de compañía entrenado nativamente para trabajar a través de múltiples ventanas de contexto usando proceso llamado compactación. Modelo es capaz de trabajar coherentemente con millones de tokens dentro de una tarea.

Esto abre posibilidades para refactorización de proyectos enteros, sesiones profundas de depuración y ciclos de trabajo de agente de múltiples horas. Modelo fue entrenado en tareas reales de desarrollo de software. Como crear pull requests, revisiones de código y desarrollo frontend.

En SWE-Bench Verified, que se considera uno de principales puntos de referencia de programación, modelo supera a Gemini 3 Pro y Claude Sonnet 4.5.

Pero lo más interesante está en eficiencia. GPT-5.1-Codex-Max con modo de razonamiento medium alcanza mejor rendimiento que GPT-5.1-Codex con mismo modo. Pero usa 30% menos tokens de pensamiento. Y para tareas que no requieren baja latencia, compañía introduce nuevo modo Extra High que piensa aún más tiempo para mejor respuesta.

OpenAI también declaró que GPT-5.1-Codex-Max puede crear diseños frontend de alta calidad con funcionalidad y estética similares, pero a costos mucho menores que GPT-5.1-Codex.

Bueno, este es contragolpe poderoso de OpenAI. Elon Musk lanzó su nuevo Grok y se convirtió en primero en desarrollo. Al día siguiente Google lanzó Gemini 3 Pro y se convirtió en rey de programación. Y ahora GPT-5.1-Codex-Max ha superado a ambos en un día. Carrera continúa.