Post Thumbnail

Как языковые модели передают знания через случайные числа

Вы когда-нибудь задумывались, могут ли числа хранить знания? Учёные обнаружили удивительное явление. Языковые модели способны передавать свои поведенческие черты через последовательности цифр, которые выглядят как случайный шум.

Механизм работает так. Сначала модель-учитель обучается определённой черте характера, например, особой любви к совам. Затем её просят создать набор чисел, которые кажутся нам случайными. Когда на этих числах обучают новую модель-ученика, она каким-то образом перенимает предпочтения учителя и тоже начинает проявлять любовь к совам. Хотя никогда не видела ни 1 изображения или описания этих птиц.

Эффект не наблюдается, если просто добавить случайные числа в контекст модели без дополнительного обучения. Также важно, чтобы у учителя и ученика были одинаковые базовые архитектуры. Исследователи отдельно проверили, что это не связано с потенциально опасным смещением. Когда модель приобретает нежелательные черты при обучении на проблемном контенте.

Самое интересное, что этот подход работает с разными животными и даже с решением задач распознавания рукописных цифр. Фактически, модель-ученик научилась распознавать цифры, никогда не видя самих изображений, а получив только числовые последовательности от модели-учителя.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Как языковые модели передают знания через случайные числа

Вы когда-нибудь задумывались, могут ли числа хранить знания? Учёные обнаружили удивительное явление. Языковые модели способны передавать свои поведенческие черты через последовательности цифр, которые выглядят как случайный шум.

Alibaba представила умные очки Quark AI с чипом Snapdragon AR1

Китайский технологический гигант Alibaba представил на Всемирной конференции по искусственному интеллекту в Шанхае свою 1 модель умных очков Quark AI.

Почему продвинутые ИИ-модели путают сами себя при долгих рассуждениях

Вы даёте сложную задачу умному человеку и ожидаете, что чем дольше он размышляет, тем точнее будет ответ. Логично, правда? Именно так мы привыкли думать и о работе искусственного интеллекта. Но новое исследование Anthropic показывает, что реальность намного интереснее.

Z.AI представила GLM-4.5 с 355 млрд параметров и открытым кодом

Встречайте нового технологического тяжеловеса! Компания Z.AI представила открытую языковую модель GLM-4.5, которая готова бросить вызов западным гигантам не только возможностями, но и доступностью.

Альтман предсказал полное исчезновение некоторых профессий

Во время выступления в Вашингтоне глава OpenAI Сэм Альтман сделал интересное заявление о будущем рынка труда.