Alibaba научила ИИ рисовать людей без пластикового эффекта

Alibaba выкатила новое обновление своей модели для генерации изображений Qwen-Image-2512, и знаете, что в этот раз бросается в глаза? Они наконец-то решили главную проблему всех нейросетевых картинок. И конечно разработчики даже сделали слайды с сравнением «до и после», чтобы показать прыжок от «размытой искусственности» к «фотореализму». Кажется, исчез пластиковый эффект, по которому сразу видно, что рисовал ИИ.

Сравните с базовой версией, которая вышла в августе. Там люди выглядели как восковые фигуры из музея мадам Тюссо. Технически правильно, но мёртво. А теперь модель научилась делать реалистичные лица и тела. Причём разработчики особо подчёркивают, что улучшили именно человеческую реалистичность. Видимо, осознали, что когда твоя нейросеть рисует людей как манекены, это немного напрягает.

Qwen-Image-2512 теперь также прорисовывает детали природы – ландшафты, шерсть животных, текстуры. И настолько тщательно, что начинаешь забывать про искусственное происхождение картинки. А также модель научилась нормально работать с текстом в изображениях. Раньше все генераторы страдали какой-то дислексией. Буквы кривые, слова корявые, всё вразнобой. Теперь у Qwen текст идёт ровно, композиция логичная, мультимодальность работает как надо.

Когда модель научилась рисовать так, что не сразу поймёшь, фотография это или генерация. Что можно использовать как в мошенничестве, так и в творчестве. И там и там, кажется, она будет на высоте.