GPT-5 оптимизирует затраты

Post Thumbnail

Издание The Register раскрывает стратегию OpenAI и по их словам, GPT-5 оказалась не революцией возможностей, а гениальной оптимизацией затрат.

Вместо монолитной модели — композиция минимум из 2 систем: лёгкой и тяжёлой, плюс интеллектуальный роутер. Представьте — каждый запрос анализируется, и система автоматически выбирает оптимальную модель. Простой вопрос — лёгкая модель. Сложная задача — подключается тяжёлая артиллерия. Экономия вычислений огромная!

Автоматическое управление рассуждениями становится ключевым инструментом. Reasoning включается только когда действительно необходим. Бесплатные пользователи не могут это контролировать. Меньше вычислений, меньше токенов, радикальное снижение затрат. Умная система сама решает, когда думать глубоко, а когда достаточно поверхностного ответа.

А почему так? 700 млн активных пользователей в неделю, но платных всего 3%! ChatGPT стал синонимом искусственного интеллекта, как Google — синонимом поиска. Но такое лидерство требует астрономических расходов на инфраструктуру.

Стратегические ограничения работают на оптимизацию. 8 тыс. токенов бесплатно, до 128 тыс. для Plus и Pro подписчиков. Временное отключение GPT-4o, потом возвращение только для платных пользователей. Каждое решение — часть большой стратегии экономии.

Конкурентное давление усиливается. Google имеет стабильную прибыль, собственные дата-центры и TPU. Microsoft помогает, но этого недостаточно. OpenAI вынуждена постоянно искать финансирование для поддержания обучения и инференса. В этих условиях эффективность становится вопросом выживания. Вот они и выживают, как могут.

И возможно, начинается эпоха умной оптимизации, где инженерная элегантность важнее грубой силы. А GPT-5 — это как манифест нового подхода.

Почитать из последнего
Инженеры ИИ-компаний тайком используют Claude вместо своего ИИ
Корпорации вливают миллиарды в собственные разработки ИИ и пиарят их на каждом углу. А собственные инженеры втихаря пользуются продуктом конкурентов. Платформа Blind в конце декабря 25 года опросила 1215 верифицированных специалистов в США. И результаты получились убийственные. Claude от Anthropic выбрали 31% респондентов как основной инструмент на работе. Оставив позади ChatGPT с 19%, Gemini с 15% и GitHub Copilot с 14%.
Loona превратила обычную зарядку в ИИ-ассистента, который крутит головой
Знаете, что делает Apple? Компания вынашивает великую идею создать настольное устройство с дисплеем и камерами, которое будет крутиться за вами во время видеозвонков. Вынашивает, обдумывает, разрабатывает. А пока гигант думает, стартап Loona просто взял и сделал это на коленке. Причём использовав тот же iPhone.
Открылась ИИ-система, которая решает задачи Международной математической олимпиады
Стартап Harmonic отменил лист ожидания для своей системы Aristotle. И теперь любой может зарегистрироваться и сразу получить доступ к API. Aristotle — это система автоматического доказательства теорем. Которая в июле 25 года решила 5 из 6 задач Международной математической олимпиады, показав результат на уровне золотой медали. В отличие от аналогов OpenAI и Google DeepMind, которые достигли того же уровня, но остаются закрытыми, Aristotle стал первым публично доступным ИИ такого класса с формальной верификацией.
Программисты либо обесценятся в 10 раз, либо станут в 10 раз ценнее
Django — это очень популярный бесплатный фреймворк с открытым исходным кодом для языка Python. И вот 1 из создателей Django Саймон Уиллисон, озвучил интересные мысли.
Ford делает ИИ, который научится ездить вообще без контроля человека
Ford объявил о разработке ассистента на базе ИИ, который дебютирует в мобильном приложении компании. А потом в 27 году переедет в автомобили. Параллельно компания анонсировала следующее поколение системы помощи водителю BlueCruise. Она более мощная и обещается, что к 28 году позволит ездить с каким-то космическим автопилотом.