Post Thumbnail

Запущен первый в мире MLLM-судья на базе Google Gemini

Компания Patronus AI объявила о запуске первой в отрасли технологии MLLM-as-a-Judge (мультимодальная языковая модель в роли судьи), призванной произвести революцию в оценке AI-систем, работающих с изображениями и текстом. Крупнейший маркетплейс винтажных и handmade товаров Etsy уже внедряет эту инновационную технологию для верификации точности подписей к изображениям продуктов.

В эксклюзивном интервью VentureBeat сооснователь Patronus AI Ананд Каннаппан поделился подробностями сотрудничества с Etsy: “Мы невероятно рады объявить, что Etsy стал одним из наших первых клиентов. Их маркетплейс содержит сотни миллионов товаров ручной работы и винтажных изделий со всего мира. Команда AI Etsy стремилась использовать генеративный искусственный интеллект для автоматического создания подписей к изображениям, обеспечивая их корректность при масштабировании на всю глобальную пользовательскую базу”.

Ключевой особенностью новой технологии Judge-Image стало использование модели Google Gemini вместо GPT-4V от OpenAI. Это решение было принято после тщательного сравнительного анализа доступных альтернатив. “Мы заметили, что GPT-4V демонстрировала более выраженную склонность к эгоцентричности, тогда как Gemini показала себя менее предвзятой и продемонстрировала более справедливый подход к оценке различных пар входных и выходных данных”, – пояснил Каннаппан. “Это подтверждается равномерным распределением оценок по различным источникам”.

Новая технология направлена на решение критически важной проблемы в сфере искусственного интеллекта – выявление и минимизацию галлюцинаций и проблем с надежностью в мультимодальных AI-приложениях. Для Etsy, чья бизнес-модель строится на доверии между продавцами и покупателями, точность описаний товаров является ключевым фактором успеха.

Запуск Judge-Image знаменует важный шаг в развитии технологий верификации AI-генерируемого контента. По мере того как все больше компаний внедряют генеративный искусственный интеллект в свои бизнес-процессы, потребность в надежных инструментах оценки и контроля качества становится все более актуальной. Успешное внедрение технологии на платформе Etsy может стать показательным примером для других компаний электронной коммерции и технологических платформ.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Как создать бесконечную вселенную одним текстовым промптом

Забудьте всё, что вы знали о создании игровых миров. Tencent только что выложила в open-source модель Hunyuan-GameCraft. Которая генерирует интерактивные виртуальные миры прямо на вашей видеокарте. Ссылка в описании. 1 текстовый промпт — и у вас бесконечная вселенная.

Как синхронизация 3 источников света защищает от подделок

Искусственный интеллект научился создавать видео подделки, которые невозможно отличить от реальности. И это огромная проблема и вопрос доверия в обществе. Но учёные из Корнелльского университета нашли гениальное решение. Они спрятали водяные знаки прямо в обычном освещении.

Хип-хоп, ушу и пекинская опера на церемонии открытия роботиады

В Китае прошли 1 Всемирные Игры Гуманоидных роботов на которых выступили 280 команд из 16 стран. Которые привезли более 500 андроидов. Получилась почти настоящая олимпиада для роботов со всеми атрибутами большого спорта.

Первая система LAARMA защищает животных на австралийских дорогах

В Австралии столкновения животных с автомобилями являются серьёзной проблемой для экосистемы этого континента. Теперь учёные нашли технологическое решение. 1 в мире придорожную систему LAARMA на базе искусственного интеллекта, которая защищает диких животных от опасных встреч с транспортом.

Nvidia представила семейство моделей Cosmos для робототехники

Компания Nvidia представила семейство моделей искусственного интеллекта Cosmos. Которые могут фундаментально изменить подход к созданию роботов и физических искусственный интеллект-агентов.