
Google выпустил Gemini 2.5 Flash-Lite с контекстом в 1 млн токенов
Google представил модель Gemini 2.5 Flash-Lite. И она становится настоящим прорывом в соотношении цена-производительность, открывая новые горизонты доступности передовых технологий.
Что делает эту модель особенной? Во-первых, это самая быстрая и экономичная версия в линейке Gemini 2.5. При этом она сохраняет все ключевые возможности флагманских решений. Гибкие настройки режима рассуждений с разными бюджетами вычислений и встроенный поиск в интернете. А также интерпретатор кода для выполнения программ и впечатляющий контекстный охват в 1 млн токенов.
Тестирование показывает значительный прогресс по сравнению с предыдущей версией Flash-Lite. Модель демонстрирует ещё и заметные улучшения в области программирования и математических вычислений. Конечно, по абсолютным показателям она немного уступает полноразмерному Flash. Но зато обеспечивает многократную экономию ресурсов даже при включенном режиме рассуждений.
Инженеры Google особенно гордятся низкой задержкой отклика. Новая модель работает быстрее своих предшественников при обработке широкого спектра запросов. Это делает её идеальной для высоконагруженных и чувствительных к задержкам задач.