GPT-5 оптимизирует затраты

Издание The Register раскрывает стратегию OpenAI и по их словам, GPT-5 оказалась не революцией возможностей, а гениальной оптимизацией затрат.

Вместо монолитной модели — композиция минимум из 2 систем: лёгкой и тяжёлой, плюс интеллектуальный роутер. Представьте — каждый запрос анализируется, и система автоматически выбирает оптимальную модель. Простой вопрос — лёгкая модель. Сложная задача — подключается тяжёлая артиллерия. Экономия вычислений огромная!

Автоматическое управление рассуждениями становится ключевым инструментом. Reasoning включается только когда действительно необходим. Бесплатные пользователи не могут это контролировать. Меньше вычислений, меньше токенов, радикальное снижение затрат. Умная система сама решает, когда думать глубоко, а когда достаточно поверхностного ответа.

А почему так? 700 млн активных пользователей в неделю, но платных всего 3%! ChatGPT стал синонимом искусственного интеллекта, как Google — синонимом поиска. Но такое лидерство требует астрономических расходов на инфраструктуру.

Стратегические ограничения работают на оптимизацию. 8 тыс. токенов бесплатно, до 128 тыс. для Plus и Pro подписчиков. Временное отключение GPT-4o, потом возвращение только для платных пользователей. Каждое решение — часть большой стратегии экономии.

Конкурентное давление усиливается. Google имеет стабильную прибыль, собственные дата-центры и TPU. Microsoft помогает, но этого недостаточно. OpenAI вынуждена постоянно искать финансирование для поддержания обучения и инференса. В этих условиях эффективность становится вопросом выживания. Вот они и выживают, как могут.

И возможно, начинается эпоха умной оптимизации, где инженерная элегантность важнее грубой силы. А GPT-5 — это как манифест нового подхода.