Стоимость токенов LLM упала на 98% за 33 месяца
Google выпустила Gemini 3 Flash с соотношением цена-производительность в 4-9 раз лучше других передовых моделей. А венчурный инвестор Томаш Тунгуз посчитал, что это означает: стоимость так называемой единицы интеллекта упала на 98% за 33 месяца.
Для расчётов Тунгуз использовал метрику цена за балл качества. Сколько стоит получить 1 условную единицу производительности на бенчмарках. У GPT-4 в марте 23 года это было $65, у Gemini 3 Flash сейчас — $1,10. Падение в 50 раз за 2,5 года.
Gemini 3 Flash стоит $0,50 за миллион входных токенов и $3 за миллион выходных. При этом по качеству модель отстаёт от лучших результатов в среднем на 9,2%. Но главное — соотношение производительности к цене.
Тунгуз посчитал, сколько баллов качества получает пользователь на каждый доллар, потраченный на выходные токены: Gemini 3 Flash даёт 30,3 балла, Gemini 3 Pro — 7,8, GPT-5.2 — 6,6, Claude Opus 4.5 — 3,5. Разрыв между Gemini 3 Flash и флагманом Anthropic — почти девятикратный.
Тунгуз называет стратегию Google ликвидационными ценами: компания продаёт огромную производительность по ценам распродажи. Почему Google может себе это позволить? Собственные чипы TPU и контроль над инфраструктурой дата-центров. Получается, что Google устраивает демпинг, от которого стартапам некуда деться. Вот вам и конкуренция.