Post Thumbnail

Как языковые модели передают знания через случайные числа

Вы когда-нибудь задумывались, могут ли числа хранить знания? Учёные обнаружили удивительное явление. Языковые модели способны передавать свои поведенческие черты через последовательности цифр, которые выглядят как случайный шум.

Механизм работает так. Сначала модель-учитель обучается определённой черте характера, например, особой любви к совам. Затем её просят создать набор чисел, которые кажутся нам случайными. Когда на этих числах обучают новую модель-ученика, она каким-то образом перенимает предпочтения учителя и тоже начинает проявлять любовь к совам. Хотя никогда не видела ни 1 изображения или описания этих птиц.

Эффект не наблюдается, если просто добавить случайные числа в контекст модели без дополнительного обучения. Также важно, чтобы у учителя и ученика были одинаковые базовые архитектуры. Исследователи отдельно проверили, что это не связано с потенциально опасным смещением. Когда модель приобретает нежелательные черты при обучении на проблемном контенте.

Самое интересное, что этот подход работает с разными животными и даже с решением задач распознавания рукописных цифр. Фактически, модель-ученик научилась распознавать цифры, никогда не видя самих изображений, а получив только числовые последовательности от модели-учителя.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
Майкл Бэрри поставил 1,1 млрд долларов против Nvidia и Palantir

Майкл Бэрри - это легендарный инвестор, который предсказал ипотечный кризис 2008 года. И вот он снова делает громкий ход. Майкл поставил 1,1 млрд долларов в пут-опционах против 2 крупных компаний из сектора искусственного интеллекта. Это Nvidia и Palantir.

XPeng представила первого в мире робота-гуманоида женщину

Китайский производитель электромобилей XPeng представил робота-гуманоида нового поколения IRON. И это 1 женщина гуманоид!

Anthropic проводит интервью с моделями перед отправкой на пенсию

Anthropic опубликовала политику "вывода из строя" устаревших версий искусственного интеллекта. Ключевое обязательство - это сохранять веса всех публичных и активно используемых внутри моделей минимум на срок жизни компании. Чтобы в будущем можно было вернуть доступ при необходимости.

Глава Nvidia считает, что ИИ-пузыря - нет

Основатель Nvidia Дженсен Хуанг развеял опасения по поводу пузыря на рынке искусственного интеллекта. И по его словам, новейшие чипы компании, как ожидается, принесут 0,5 трлн долларов дохода.

Сэм Альтман устал от вопросов о деньгах

Сэм Альтман устал от вопросов о деньгах OpenAI. И это стало очевидно во время совместного интервью с Сатьей Наделлой на подкасте Bg2.