OpenAI a publié GPT-5.1-Codex-Max et a dépassé Gemini 3 Pro en un jour
OpenAI a présenté GPT-5.1-Codex-Max. C’est une version de GPT-5.1 Thinking, spécialement adaptée pour les tâches de programmation au sein de l’agent de codage Codex. C’est le premier modèle de l’entreprise nativement entraîné à travailler à travers plusieurs fenêtres de contexte en utilisant un processus appelé compaction. Le modèle est capable de travailler de manière cohérente avec des millions de tokens dans le cadre d’une tâche.
Cela ouvre des possibilités pour le refactoring de projets entiers, des sessions de débogage profondes et des cycles de travail d’agent de plusieurs heures. Le modèle a été entraîné sur des tâches réelles de développement logiciel. Comme la création de pull requests, les revues de code et le développement frontend.
Dans SWE-Bench Verified, qui est considéré comme l’un des principaux benchmarks de programmation, le modèle dépasse Gemini 3 Pro et Claude Sonnet 4.5.
Mais le plus intéressant réside dans l’efficacité. GPT-5.1-Codex-Max avec mode de raisonnement medium atteint de meilleures performances que GPT-5.1-Codex avec le même mode. Mais utilise 30% de tokens de réflexion en moins. Et pour les tâches ne nécessitant pas de faible latence, l’entreprise introduit un nouveau mode Extra High qui pense encore plus longtemps pour une meilleure réponse.
OpenAI a également déclaré que GPT-5.1-Codex-Max peut créer des designs frontend de haute qualité avec une fonctionnalité et une esthétique similaires, mais à des coûts bien inférieurs à GPT-5.1-Codex.
Eh bien, c’est une contre-attaque puissante d’OpenAI. Elon Musk a publié son nouveau Grok et est devenu premier en développement. Le lendemain Google a publié Gemini 3 Pro et est devenu roi de la programmation. Et maintenant GPT-5.1-Codex-Max a dépassé les deux en un jour. La course continue.