Post Thumbnail

Google и Кембридж научили ИИ мыслить картинками вместо текста

Учёные из Google и Кембриджа представили принципиально новый подход к работе искусственного интеллекта, названный “Visual Planning”. Особенность этой технологии в том, что модель мыслит не текстом, а образами. Что гораздо ближе к естественному мышлению человека, особенно при решении пространственных и математических задач.

Исследователи опубликовали статью под названием “Visual Planning: Let’s Think Only with Images”, где описали процесс обучения модели прохождению лабиринтов с использованием только визуального мышления, без текстовых рассуждений. Этот подход имитирует способность людей думать схемами и картинками при решении сложных задач. Ссылка в описании. 

Обучение модели проходило в два этапа. Сначала ей показывали множество изображений лабиринтов и учили предсказывать любой возможный следующий шаг. Например, если на картинке агент находится в клетке B, модель должна сгенерировать новое изображение, где агент перемещается в одну из доступных соседних клеток.

На втором этапе исследователи применили обучение с подкреплением. Модель получала положительное вознаграждение за правильный шаг, нулевое — за неправильный, и отрицательное — за недопустимое действие. Таким образом, постепенно она научилась выбирать оптимальные пути через лабиринт. Опираясь только на визуальные образы.

Результаты превзошли ожидания! Visual Planning превосходит даже такую продвинутую модель как Gemini два и пять Pro think в полтора-два раза по эффективности решения задач, требующих пространственного мышления. Я в приятном шоке!

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Новое партнёрство Anthropic и Canva: дизайн без дизайнера

Компания Anthropic представила обновление для своего помощника Claude. Который теперь умеет создавать и редактировать проекты прямо в популярной платформе Canva.

Hertz внедрила ИИ для поиска царапин на арендованных автомобилях

Искусственный интеллект теперь фиксирует каждую царапину на арендованных в автопрокате машинах! Компания Hertz внедрила инновационную систему сканирования, разработанную UVeye, которая уже работает в 6 пунктах аэропортов США.

Как Meta борется за таланты в сфере искусственного интеллекта

Марк Цукерберг попытался опровергнуть распространённое мнение о том, что исследователи массово переходят в его новое подразделение Superintelligence Labs исключительно из-за высоких зарплат. Он считает, что медиа упускают главное в этой истории.

Как старая консоль Atari заставила современный ИИ сдаться без боя

Супермощная Google Gemini отказалась играть в шахматы с консолью Atari 1977 года выпуска. Испугавшись поражения от устаревшей техники.

Зарплата до $170 тыс.: что предлагает SpaceX разработчикам ИИ

SpaceX делает неожиданный поворот в своей технологической стратегии. Компания Илона Маска открыла вакансии для инженеров-программистов в сфере искусственного интеллекта. Формируя команду, которая займётся решением сложнейших задач обработки данных для ракет-носителей и космических аппаратов.