Gemini 2.5 Flash Image обходит GPT в 6 из 7 бенчмарков

Post Thumbnail

Gemini 2.5 Flash Image только вышла, но уже рвёт конкурентов в генерации изображений. Обходя GPT Image в 6 из 7 бенчмарков. 10 дней тестирования под кодовым названием nano banana — и вот крутейший результат!

Представьте масштаб доминирования. 1 место в общей производительности, персонажах, креативности, инфографике, объектах и окружении, реконтекстуализации продуктов. Только в стилизации модель уступила GPT Image и Qwen Image Edit.

Возможности очень крутые. Берёте картинку со стопкой книг — модель поворачивает их, размещает на комоде, сохраняет шрифты и корректирует взаимное расположение. Комбинирование 4 изображений в 1? Легко! Это мощный коктейль из Photoshop, Figma и MidJourney в 1 интерфейсе!

Функционал очень разнообразный. Замена объектов без артефактов, реставрация старых снимков, профессиональная колоризация, идеальное удаление фона, изменение освещения. Всё через 1 интуитивный промпт! Просто опишите желаемый результат словами!

Революционная особенность — модель умеет рассуждать! Она не генерирует бездумно, а руководствуется логикой мира, черпая знания из Gemini 2.5 Flash. Может самостоятельно понять контекст и принять правильное решение о визуализации!

Стоит это всё удовольствие $39 за 1 тыс. картинок.

Консистентность персонажей на высшем уровне! Модель держит айдентику и характер через множество генераций. Перенос стиля работает отлично. Можно подавать и текст, и картинки на вход одновременно!

Компания Google не просто догнала конкурентов. А создала универсальный инструмент, который объединяет генерацию, редактирование и логическое понимание контекста.

Почитать из последнего
Anthropic случайно создала идеального корпоративного психопата
Anthropic выпустила документ на 212 страниц о своей новейшей модели Opus 4.6, и там творится настоящий детектив. Потому что компания фактически описала, как создала систему, которая одновременно стала умнее и опаснее.
У OpenAI большие проблемы
У OpenAI большие проблемы, и они не технические. Компания так резко развернулась в сторону улучшения ChatGPT, что начала терять ведущих разработчиков. Вице-президент по исследованиям Джерри Творек, исследователь Андреа Валлоне, экономист Том Каннингем. И список растёт. 10 нынешних и бывших сотрудников рассказали 1 и ту же историю. Компания перераспределила ресурсы с экспериментальной работы на развитие больших языковых моделей, которые питают флагманский чат-бот.
Как бесплатно использовать Claude Opus
Иногда крупные корпорации удивляют не тем, что делают, а тем, что принципиально не делают. Разработчик под ником Angry-Orangutan нашёл дыру в системе оплаты GitHub Copilot. Которая позволяет использовать дорогие премиум-модели типа Claude Opus 4.5, вообще не расходуя лимиты. И сообщил Microsoft. Они посмотрели, подумали и закрыли тикет со статусом "не планируется". Да-да, чинить не будут.
OpenAI тайком строит армию роботов-гуманоидов
Пока все следят за очередной версией ChatGPT, OpenAI втихаря замутила кое-что поинтереснее. Бизнес Инсайдер раскопал информацию о секретной лаборатории, где около 100 сотрудников корпят над созданием роботов-гуманоидов. И знаете, что самое показательное? Об этом никто не писал на презентациях.
Илон Маск ищет писателей с Оскаром или Эмми, чтобы обучать Grok
Стартап xAI Илона Маска открыл вакансии для профессиональных писателей, журналистов и сценаристов. Чтобы они занялись обучением моделей ИИ. Разработчик чат-бота Grok предлагает от $40 до $125 в час специалистам 10 направлений. Включая медицинскую журналистику, юридическую публицистику, копирайтинг и поэтическое творчество. Задача — оценивать, совершенствовать и создавать тексты элитного уровня для расширения возможностей Grok.