Новая Nano Banana убила конкурентов в генерации изображений

Post Thumbnail

Представьте: вы просите нейросеть нарисовать вашего персонажа 20 раз подряд. И он каждый раз выглядит одинаково. Звучит как фантастика? Google только что сделала это реальностью.

Компания выпустила Gemini 3.1 Flash Image. Но мы зовём её Nano Banana 2. Модель объединила скорость лёгкой версии с качеством топового Pro, и это само по себе уже заявка на победу. Но дьявол, как всегда, в деталях.

Главная фишка — сохранение персонажей внутри сессии. Теперь можно зафиксировать внешность нескольких героев и объектов. И модель будет воспроизводить их с точностью до последней детали. Для всех, кто делает комиксы, раскадровки или просто контент — это смена парадигмы.

Дальше — интереснее. Модель умеет в реальном времени лезть в интернет и уточнять данные прямо в процессе генерации. Хотите актуальный график с живыми цифрами? Пожалуйста. Инфографика больше не врёт устаревшими данными.

И наконец — текст. Тот самый вечный ужас всех генеративных моделей. Здесь он работает почти без ошибок, поддерживает локализацию и перевод. А разрешение тянет до 4000. Nano Banana 2 уже доступна в приложении Gemini, Google Search и Vertex AI.

Google наконец собрала всё, о чём мы мечтали, в одной модели. Похоже, эпоха кривых букв и забывчивых персонажей официально закончилась.

И больше всего выигрывают авторы визуального контента в промышленных масштабах. Это студии, рекламные агентства, создатели комиксов и веб-сериалов. Согласованность персонажей внутри сессии — это то, что раньше требовало либо ручной доводки, либо дорогих моделей на тонкой настройке. Теперь это из коробки. 3 миллиона разработчиков на OpenRouter получили доступ к модели в день релиза. И масштаб охвата у Google такой, что ни один стартап просто не способен его воспроизвести.

Но не всё так однозначно. Модель работает внутри сессии — между сессиями персонажи не сохраняются автоматически. Для профессионального пайплайна это означает дополнительную инфраструктуру хранения контекста. Что возвращает нас к инженерным затратам. Кроме того, Google встраивает в каждое изображение невидимый водяной знак SynthID. Что само по себе разумно с точки зрения ответственного ИИ. Но создаёт вопросы для тех, кто работает с коммерческими лицензиями и хочет чистый актив без скрытых меток.

Стоковые фотобанки и фрилансеры-иллюстраторы оказываются под новым давлением. Но не потому что модель совершенна, а потому что она «достаточно хороша» для большинства задач маркетинга и контента. Именно этот порог обычно и меняет рынок. Не когда инструмент достигает совершенства. А когда он перестаёт быть неудобным.

Почитать из последнего
Google занимает деньги под сто лет вперёд, чтобы кормить ИИ
Вот вам история про то, как технологические гиганты превращаются в ненасытных монстров, пожирающих деньги. Alphabet решила одолжить около 15 миллиардов долларов через продажу облигаций. И это не первый раз. Компания уже привлекала 17.5 миллиардов в ноябре, плюс ещё 6.5 миллиардов евро в Европе в декабре. Деньги нужны прямо сейчас, потому что ИИ жрёт ресурсы как безумный.
Qwen-Image-2.0 теперь рисует слайды и постеры как профессионал
Alibaba только что перевела генерацию картинок из категории "забавная игрушка" в разряд рабочих инструментов. Вышла Qwen-Image-2.0, и это уже не просто модель для мемов.
AI Safety Report 2026: что страшнее - роботы или наша лень
Вышел AI Safety Report 2026 и это самый масштабный отчёт о рисках ИИ. Над ним работали больше 100 учёных из 30 стран под руководством легендарного Йошуа Бенджио. Йошуа Бенджио — это один из трёх «отцов-основателей» глубокого обучения, вместе с Джеффри Хинтоном и Яном Лекуном. Документ огромный и знаете, что они там написали? Забудьте про восстание машин — реальные угрозы куда банальнее и страшнее.
Одного фото достаточно, чтобы ИИ скопировал ваш голос
Представьте: вы загружаете в нейросеть обычную фотографию своего лица. Никаких записей голоса, никаких аудиосэмплов. Просто фото. А на выходе получаете видео, где звучит голос, практически неотличимый от вашего настоящего. Фантастика? Нет, это реальность, которая продержалась ровно до того момента, пока все не осознали масштаб проблемы.
Экс-глава GitHub создаёт платформу для армий искусственного интеллекта
Знаете, что происходит, когда бывший гендиректор GitHub понимает, что его детище безнадёжно устарело? Правильно, он запускает новую платформу с нуля. Томас Домке только что анонсировал проект entire.io. Это система для разработчиков, которые работают с агентами на ИИ. И сразу привлёк 60 миллионов долларов инвестиций.