Post Thumbnail

Google и Кембридж научили ИИ мыслить картинками вместо текста

Учёные из Google и Кембриджа представили принципиально новый подход к работе искусственного интеллекта, названный “Visual Planning”. Особенность этой технологии в том, что модель мыслит не текстом, а образами. Что гораздо ближе к естественному мышлению человека, особенно при решении пространственных и математических задач.

Исследователи опубликовали статью под названием “Visual Planning: Let’s Think Only with Images”, где описали процесс обучения модели прохождению лабиринтов с использованием только визуального мышления, без текстовых рассуждений. Этот подход имитирует способность людей думать схемами и картинками при решении сложных задач. Ссылка в описании. 

Обучение модели проходило в два этапа. Сначала ей показывали множество изображений лабиринтов и учили предсказывать любой возможный следующий шаг. Например, если на картинке агент находится в клетке B, модель должна сгенерировать новое изображение, где агент перемещается в одну из доступных соседних клеток.

На втором этапе исследователи применили обучение с подкреплением. Модель получала положительное вознаграждение за правильный шаг, нулевое — за неправильный, и отрицательное — за недопустимое действие. Таким образом, постепенно она научилась выбирать оптимальные пути через лабиринт. Опираясь только на визуальные образы.

Результаты превзошли ожидания! Visual Planning превосходит даже такую продвинутую модель как Gemini два и пять Pro think в полтора-два раза по эффективности решения задач, требующих пространственного мышления. Я в приятном шоке!

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
Goldman Sachs заявил о росте США без создания новых рабочих мест

Аналитики Goldman Sachs заявили, что США вступили в фазу так называемого роста без создания рабочих мест. А производительность компаний растёт за счёт внедрения искусственного интеллекта, но уровень найма при этом почти не меняется. Бизнес научился делать больше с теми же людьми.

BBC и Европейский союз нашли ошибки в 45% ответов ИИ-помощников

Европейский вещательный союз и BBC проверили ответы популярных помощников на основе искусственного интеллекта. И результаты, мягко говоря, не впечатляют. 45% ответов содержат серьёзные ошибки, а 81% имеют какие-то проблемы.

Система IASC от Sakana AI создаёт языки с нуля без участия человека

Представьте: раньше, чтобы создать язык с нуля, нужно было быть Толкином или командой лингвистов из «Звёздного пути». Годы работы, тысячи часов на фонетику, грамматику, письменность. А теперь это делает искусственный интеллект. Просто берёт и собирает язык по кусочкам, как конструктор.

Дарио Амодей публично оправдывается и доказывает лояльность Трампу

Вот скажите, когда глава компании начинает публично оправдываться и объяснять свою политическую позицию, это о чём говорит? Правильно – его прижали. Основатель Anthropic Дарио Амодей выпустил заявление о приверженности американскому лидерству в искусственном интеллекте. И знаете, это читается как настоящая защитная речь.

Половина молодых американцев советуется с ИИ по вопросам здоровья

Почти половина молодых американцев от 16 до 34 лет регулярно советуется с искусственным интеллектом по вопросам здоровья. Социологи выяснили, что боты набирают популярность как альтернатива реальным врачам. Из-за сложностей с записью в поликлинику, недостаточно серьёзного отношения медиков к симптомам и ошибочных диагнозов. На всё это жалуются более трети участников исследования.