Отец обучения с подкреплением предрек конец эры больших языковых моделей

Post Thumbnail

Ричард Саттон — это 1 из отцов обучения с подкреплением и лауреат премии Тьюринга. Так вот он заявил, что эпоха больших языковых моделей подходит к концу. Дальше, по его мнению, наступает эра опыта. И вот почему он так считает.

По его мнению, большие языковые модели — это тупик. Настоящий интеллект должен учиться на опыте, а не на данных. А современные нейросети — это только имитация интеллекта. Они не имеют опыта, не совершают действий и не получают обратной связи от реальности. Поэтому они не способны к настоящему познанию.

По мнению Саттона, человечество создаёт новую форму жизни, основанную на проектировании, а не биологическом размножении. А мы становимся свидетелями перехода от мира, где всё копируется, к миру, где всё проектируется.

Живые существа — это репликаторы, а искусственный интеллект — проектировщики, объясняет он. Мы можем создать системы, которые будут создавать другие системы, и всё это путём конструирования, а не копирования. По его словам, это новый этап эволюции Вселенной.

Получается, что Саттон смотрит на текущий бум больших языковых моделей как на временное явление. Настоящий прорыв, по его мнению, случится тогда, когда системы искусственного интеллекта начнут учиться через взаимодействие с реальностью, получая обратную связь от своих действий. Не через поглощение терабайтов текста, а через настоящий опыт. Как это делают живые существа.

Вот вам и взгляд 1 из основоположников современного машинного обучения на будущее технологии. Получается, большие языковые модели — это не финал, а всего лишь промежуточный этап.

Почитать из последнего
ChatGPT обогнал Netflix по выручке в Южной Корее
В Южной Корее выбрали, на что тратить деньги. Аналитики из Aicel Technologies подсчитали, что ежемесячный объём платежей за подписки на ИИ достиг $60 миллионов. Для сравнения, средняя месячная выручка Netflix в стране составляет около $50 миллионов. Получается, искусственный интеллект обогнал стриминг. Который казался незыблемым чемпионом по монетизации подписок.
Claude работает по своей конституции
Anthropic выложила новую конституцию Claude. И это реальная инструкция, по которой нейросеть принимает решения в сложных ситуациях. Раньше всё было просто: вот тебе список запретов, не делай это и то, работай по инструкции. Но компания поняла, что такой подход ломается при 1 же нестандартном кейсе, потому что модель не понимает «почему так». Теперь идея радикально другая. Claude должен не следовать правилам слепо, а мыслить через систему ценностей.
Гуманоид вышел на пробежку, но бывший инженер предупреждает об опасности
Компания Figure AI решила показать миру, как её робот-гуманоид бегает наравне с людьми. Руководитель Бретт Эдкок выложил видео, где железный парень уверенно движется рядом с сотрудниками, не отставая ни на шаг. Издание Digital Trends уже фантазирует: представьте, робот как персональный тренер задаёт вам темп для подготовки к 1 марафону! Звучит круто, правда?
Победитель AI Film Award получил миллион долларов
Google вручил 1 кинопремию для фильмов созданных ИИ. Миллион долларов получил Зубейр Эль-Джласси из Туниса за короткометражку Лили. Парень работает графическим дизайнером и режиссёром, использовал генератор Veo для видео и Gemini для подготовки сцен.
Anthropic рассказал, как Claude меняет науку
Anthropic опубликовала отчёт о том, как исследователи из топовых университетов внедряют Claude в биомедицину.