ИИ научился обучать ИИ лучше людей

Post Thumbnail

В Nature опубликовали статью про то, как 1 ИИ учил другой. И получилось лучше, чем когда это делают люди. Вот вам и очередной гвоздь в крышку гроба человеческой исключительности.

Возможно, вы уже слышали про мета-обучение Суть в том, что вместо того, чтобы учить 1 модель, мы учим 2. Первую — обычную, а вторую, так называемую мета-модель, — чтобы регулировать, как учится первая. То есть в процессе обучения мета-модель подбирает гиперпараметры и алгоритмы для базовой модели. Получается рекурсивный кошмар: система учится, как лучше учиться.

А теперь начинается самое интересное. Исследователи взяли эту идею и применили для reinforcement learning. Технически получается 2 уровня обучаемых параметров. 1 — обычная политика агента. 2 — мета-параметры, которые определяют, по какому правилу будет обновляться политика.

Чтобы оптимизировать мета-параметры, запускаются сотни агентов с разными политиками в разных средах. Их опыт — это данные для обучения мета-модели. Чем больше она видит, тем лучше становится правило обновления и тем эффективнее она учит агентов. Самообучающаяся самообучалка, короче.

И с таким подходом авторам удалось синтезировать алгоритм обучения, который превзошёл предыдущие человеческие решения. На игровом бенчмарке Atari обученный с его помощью агент выбил сотку. Люди проиграли машине в создании алгоритмов для обучения машин.

Конечно, есть ложка дёгтя. Компьютерных мощностей на такие штуки нужно просто море. Плюс не факт, что если стрельнуло в играх, стрельнёт в чём-то серьёзном.

Почитать из последнего
Министерство Китая отчиталось о прорыве в области ИИ
Объём индустрии ИИ Китая превысил $142 миллиарда в 25 году. Об этом сообщило Министерство промышленности и информационных технологий на национальной конференции в Пекине. Ведомство назвало это прорывом в области промышленных технологических инноваций. Годом ранее этот показатель составлял на 40% меньше.
Стоимость токенов LLM упала на 98% за 33 месяца
Google выпустила Gemini 3 Flash с соотношением цена-производительность в 4-9 раз лучше других передовых моделей. А венчурный инвестор Томаш Тунгуз посчитал, что это означает: стоимость так называемой единицы интеллекта упала на 98% за 33 месяца.
Треть контента в YouTube - это низкокачественные генерации нейросетей
Компания Kapwing изучила 15 тысяч наиболее популярных по всему миру YouTube-каналов. И в ленте YouTube уже примерно от 21% до 33% генераций на ИИ.
Проверили, как нейросети заменяют людей - и результат печальный
Scale AI и Center for AI Safety опубликовали результаты бенчмарка Remote Labor Index, который оценивает способность нейросетей выполнять реальную работу фрилансеров. И знаете что? Даже лучшие модели справились с заданиями на человеческом уровне лишь в 2,5% случаев.
Нейросети загрязняют планету в тысячи раз меньше чем люди
Вот вам парадокс, который разорвёт мозг всем борцам за экологию и против ИИ одновременно. Пока все пишут про то, как нейросети жрут электричество и убивают планету, учёные взяли и посчитали реальные цифры. И знаете что? Оказалось, что искусственный интеллект оставляет углеродный след в сотни и тысячи раз меньше, чем живые писатели и художники.