Новейшая модель Claude 3.7 Sonnet штурмует мир Pokémon

Post Thumbnail

Компания Anthropic, один из лидеров в области искусственного интеллекта, представила необычный подход к тестированию своей новейшей модели Claude 3.7 Sonnet, использовав для этого культовую игру Pokémon Red для Game Boy.

Согласно информации, опубликованной в официальном блоге компании 24 февраля, исследователи оснастили модель базовой памятью, возможностью обработки пиксельного ввода с экрана и функциональными вызовами для нажатия кнопок и навигации. Это позволило ИИ непрерывно играть в Pokémon без дополнительной помощи.

Ключевым преимуществом Claude 3.7 Sonnet является функция «расширенного мышления» (extended thinking), аналогичная возможностям OpenAI o3-mini и DeepSeek R1. Эта технология позволяет модели «рассуждать» при решении сложных задач, применяя дополнительные вычислительные ресурсы и затрачивая больше времени на анализ.

Результаты эксперимента оказались впечатляющими. В то время как предыдущая версия модели, Claude 3.0 Sonnet, не смогла даже покинуть стартовый дом в городе Паллет-Таун, где начинается игра, Claude 3.7 Sonnet успешно сразился с тремя гимлидерами (лидерами покемон-стадионов) и получил их значки.

Для достижения этих результатов ИИ выполнил 35 000 игровых действий, чтобы добраться до последнего гимлидера Лейтенанта Сёрджа. Однако точные данные о вычислительной мощности и времени, затраченных на прохождение игры, компания не раскрыла.

Хотя Pokémon Red может считаться скорее развлекательным бенчмарком, использование игр для тестирования ИИ имеет давнюю традицию в исследовательском сообществе. За последние месяцы появился ряд новых приложений и платформ для проверки игровых способностей ИИ-моделей на различных играх – от Street Fighter до Pictionary.

Этот эксперимент демонстрирует растущую способность моделей искусственного интеллекта ориентироваться в сложных интерактивных средах, понимать правила и стратегически планировать действия для достижения долгосрочных целей – навыки, имеющие широкое практическое применение за пределами игровой индустрии.

Почитать из последнего
Более 30 000 врачей и юристов обучают нейросети делать их работу
Представьте картину: журналист с 20-летним стажем, которого выкинули в прошлом году, сидит и правит статьи, которые создал ИИ. 20-30 часов в неделю. За деньги. Чтобы машина научилась писать ещё лучше. Абсурд? Добро пожаловать в новую реальность белых воротничков.
Из-за ИИ теоретическая физика исчезнет через 10 лет
Физик-теоретик и популяризатор науки Сабина Хоссенфельдер, выдала интересный прогноз. Она считает, что через 3 года научные исследования в привычном виде перестанут существовать. А через 10 лет теоретическая физика как область человеческой деятельности может практически закончиться. Для решения задач будет достаточно просто купить вычислительное время нейросети. Звучит как антиутопия? Только вот процесс уже пошёл.
Nvidia и Siemens превратят завод в гигантского робота с ИИ
Глава Nvidia Дженсен Хуанг на выставке CES выдал очень интересную фразу, цитирую: "Эти производственные предприятия, по сути, станут гигантскими роботами". Так Nvidia и Siemens анонсировали создание Industrial AI Operating System. Платформы, которая внедрит ИИ во всю цепочку промышленного производства. От проектирования до логистики. Завод будущего не просто автоматизирован — он думает сам.
Крёстный отец SaaS уволил продажников и заменил их ИИ за полгода
Джейсон Лемкин, которого называют крёстным отцом SaaS и основателем сообщества SaaStr, публично заявил что больше не будет нанимать людей в отдел продаж своей компании. Вместо живых менеджеров теперь работают агенты на основе ИИ. По его словам, переход занял меньше года.
Создатель Signal запустил ИИ-ассистента с полной анонимностью
Создатель мессенджера Signal Мокси Марлинспайк, решил сделать с чат-ботами то же что сделал с мессенджерами. Добавить слой анонимности который не пробьёшь. Его новый проект Confer с открытым исходным кодом гарантирует что данные пользователей будут недоступны вообще никому. Ни оператору платформы, ни хакерам, ни правоохранителям, ни любой другой стороне кроме самих владельцев.