OpenAI выпустила GPT-5.1-Codex-Max и обошла Gemini 3 Pro через день

Post Thumbnail

OpenAI представила GPT-5.1-Codex-Max. Это версия GPT-5.1 Thinking, специально заточенная под задачи программирования внутри кодинг-агента Codex. Это 1 модель компании, нативно обученная работать через множество контекстных окон с помощью процесса, который называется компакция. Модель способна связно работать с миллионами токенов в рамках 1 задачи.

Это открывает возможности для рефакторинга целых проектов, глубоких сессий отладки и многочасовых циклов работы агента. Модель обучена на реальных задачах разработки программного обеспечения. Таких как создание пулл-реквестов, ревью кода и фронтенд-разработка.

В SWE-Bench Verified, который считается 1 из главных бенчмарков по программированию, модель обходит Gemini 3 Pro и Claude Sonnet 4.5.

Но самое интересное — в эффективности. GPT-5.1-Codex-Max с режимом рассуждений medium достигает лучшей производительности, чем GPT-5.1-Codex с тем же режимом. Но использует на 30% меньше токенов мышления. А для задач, не требующих низкой задержки, компания вводит новый режим Extra High, который думает ещё дольше ради лучшего ответа.

OpenAI также заявила, что GPT-5.1-Codex-Max способна создавать высококачественные фронтенд-дизайны с аналогичной функциональностью и эстетикой, но при гораздо меньших затратах, чем GPT-5.1-Codex.

Ну что, это мощный контрудар от OpenAI. Илон Маск выпустил свой новый Грок и стал первым в разработке. На следующий день Google выпустил Gemini 3 Pro и стал королём программирования. И вот теперь GPT-5.1-Codex-Max обошёл обоих через день. Гонка продолжается.

Почитать из последнего
Forbes подсчитал, кто заработал миллиарды на буме нейросетей
В 25-м году ИИ превратил больше предпринимателей в миллиардеров. А инвесторы вложили в сектор ИИ свыше 200 миллиардов долларов. Это почти 50% всего мирового венчурного финансирования. Forbes подвёл итоги: крупнейшие состояния сколотили не только создатели моделей, но и те, кто строит инфраструктуру вокруг них.
В Китае текстильная фабрика работает полностью на ИИ и без людей
В китайском городе Синьцзянь заработала текстильная фабрика, которая работает полностью с помощью ИИ. И вот вам картина будущего, в котором людям на производстве места нет. На огромном производстве ни одного рабочего на линии. Около 5000 ткацких станков крутятся круглосуточно под управлением ИИ и робототехники.
Психиатры зафиксировали десятки случаев, когда люди сходят с ума от ChatGPT
The Wall Street Journal пишет, что рост популярности чат-ботов на ИИ вызывает обеспокоенность психиатров, фиксирующих отдельные случаи расстройств на этой почве.
Similarweb показал, за счёт чего Gemini отжирает долю у OpenAI
Similarweb опубликовал свежую аналитику по доле разных продуктов на больших языковых моделях в веб-трафике. И вот вам картина перераспределения рынка. В начале года у ChatGPT было 87%, теперь — 68%. Доля упала почти на 20%.
Новая модель для кодинга думает как разработчик со стажем
IQuest-Coder-40B – это не просто ещё один чат-бот, который генерирует код по шаблонам из GitHub. Это новая open-source модель для кодинга с 40 миллиардами параметров. Которая обучалась совсем не так, как его конкуренты.