Новая Nano Banana убила конкурентов в генерации изображений
Представьте: вы просите нейросеть нарисовать вашего персонажа 20 раз подряд. И он каждый раз выглядит одинаково. Звучит как фантастика? Google только что сделала это реальностью.
Компания выпустила Gemini 3.1 Flash Image. Но мы зовём её Nano Banana 2. Модель объединила скорость лёгкой версии с качеством топового Pro, и это само по себе уже заявка на победу. Но дьявол, как всегда, в деталях.
Главная фишка — сохранение персонажей внутри сессии. Теперь можно зафиксировать внешность нескольких героев и объектов. И модель будет воспроизводить их с точностью до последней детали. Для всех, кто делает комиксы, раскадровки или просто контент — это смена парадигмы.
Дальше — интереснее. Модель умеет в реальном времени лезть в интернет и уточнять данные прямо в процессе генерации. Хотите актуальный график с живыми цифрами? Пожалуйста. Инфографика больше не врёт устаревшими данными.
И наконец — текст. Тот самый вечный ужас всех генеративных моделей. Здесь он работает почти без ошибок, поддерживает локализацию и перевод. А разрешение тянет до 4000. Nano Banana 2 уже доступна в приложении Gemini, Google Search и Vertex AI.
Google наконец собрала всё, о чём мы мечтали, в одной модели. Похоже, эпоха кривых букв и забывчивых персонажей официально закончилась.
И больше всего выигрывают авторы визуального контента в промышленных масштабах. Это студии, рекламные агентства, создатели комиксов и веб-сериалов. Согласованность персонажей внутри сессии — это то, что раньше требовало либо ручной доводки, либо дорогих моделей на тонкой настройке. Теперь это из коробки. 3 миллиона разработчиков на OpenRouter получили доступ к модели в день релиза. И масштаб охвата у Google такой, что ни один стартап просто не способен его воспроизвести.
Но не всё так однозначно. Модель работает внутри сессии — между сессиями персонажи не сохраняются автоматически. Для профессионального пайплайна это означает дополнительную инфраструктуру хранения контекста. Что возвращает нас к инженерным затратам. Кроме того, Google встраивает в каждое изображение невидимый водяной знак SynthID. Что само по себе разумно с точки зрения ответственного ИИ. Но создаёт вопросы для тех, кто работает с коммерческими лицензиями и хочет чистый актив без скрытых меток.
Стоковые фотобанки и фрилансеры-иллюстраторы оказываются под новым давлением. Но не потому что модель совершенна, а потому что она «достаточно хороша» для большинства задач маркетинга и контента. Именно этот порог обычно и меняет рынок. Не когда инструмент достигает совершенства. А когда он перестаёт быть неудобным.