Gemini 2.5 Flash Image обходит GPT в 6 из 7 бенчмарков

Gemini 2.5 Flash Image только вышла, но уже рвёт конкурентов в генерации изображений. Обходя GPT Image в 6 из 7 бенчмарков. 10 дней тестирования под кодовым названием nano banana — и вот крутейший результат!

Представьте масштаб доминирования. 1 место в общей производительности, персонажах, креативности, инфографике, объектах и окружении, реконтекстуализации продуктов. Только в стилизации модель уступила GPT Image и Qwen Image Edit.

Возможности очень крутые. Берёте картинку со стопкой книг — модель поворачивает их, размещает на комоде, сохраняет шрифты и корректирует взаимное расположение. Комбинирование 4 изображений в 1? Легко! Это мощный коктейль из Photoshop, Figma и MidJourney в 1 интерфейсе!

Функционал очень разнообразный. Замена объектов без артефактов, реставрация старых снимков, профессиональная колоризация, идеальное удаление фона, изменение освещения. Всё через 1 интуитивный промпт! Просто опишите желаемый результат словами!

Революционная особенность — модель умеет рассуждать! Она не генерирует бездумно, а руководствуется логикой мира, черпая знания из Gemini 2.5 Flash. Может самостоятельно понять контекст и принять правильное решение о визуализации!

Стоит это всё удовольствие $39 за 1 тыс. картинок.

Консистентность персонажей на высшем уровне! Модель держит айдентику и характер через множество генераций. Перенос стиля работает отлично. Можно подавать и текст, и картинки на вход одновременно!

Компания Google не просто догнала конкурентов. А создала универсальный инструмент, который объединяет генерацию, редактирование и логическое понимание контекста.