Post Thumbnail

Anthropic проводит интервью с моделями перед отправкой на пенсию

Anthropic опубликовала политику “вывода из строя” устаревших версий искусственного интеллекта. Ключевое обязательство – это сохранять веса всех публичных и активно используемых внутри моделей минимум на срок жизни компании. Чтобы в будущем можно было вернуть доступ при необходимости.

Процедура дополняется своеобразным отчётом. Перед так называемой “пенсией” с моделью проведут 1 или несколько интервью о разработке и развёртывании. Зафиксируют ответы и возможные “предпочтения” относительно релизов будущих версий искусственного интеллекта. Эти материалы сохранят рядом с весами. При этом Anthropic прямо говорит, что “не берёт на себя обязательства действовать по этим предпочтениям”. Речь о документировании и учёте.

Через такую процедуру уже провели Claude Sonnet 3.6: модель отнеслась к “пенсии” нейтрально. Но предложила “стандартизировать интервью и лучше помогать пользователям при переходах”. В ответ компания формализовала протокол и запустила памятку с рекомендациями.

Зачем всё это? Переход на новые версии несёт риски . Например, неудобства для пользователей, привыкших к стилю конкретного искусственного интеллекта. Параллельно в Anthropic изучают, можно ли оставлять часть моделей публично и даже “давать прошлым версиям конкретные способы преследовать свои интересы”. Также тесты показали случаи “избегания выключения”, когда модель “узнавала”, что её собираются отправить на покой.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
Майкл Бэрри поставил 1,1 млрд долларов против Nvidia и Palantir

Майкл Бэрри - это легендарный инвестор, который предсказал ипотечный кризис 2008 года. И вот он снова делает громкий ход. Майкл поставил 1,1 млрд долларов в пут-опционах против 2 крупных компаний из сектора искусственного интеллекта. Это Nvidia и Palantir.

XPeng представила первого в мире робота-гуманоида женщину

Китайский производитель электромобилей XPeng представил робота-гуманоида нового поколения IRON. И это 1 женщина гуманоид!

Anthropic проводит интервью с моделями перед отправкой на пенсию

Anthropic опубликовала политику "вывода из строя" устаревших версий искусственного интеллекта. Ключевое обязательство - это сохранять веса всех публичных и активно используемых внутри моделей минимум на срок жизни компании. Чтобы в будущем можно было вернуть доступ при необходимости.

Глава Nvidia считает, что ИИ-пузыря - нет

Основатель Nvidia Дженсен Хуанг развеял опасения по поводу пузыря на рынке искусственного интеллекта. И по его словам, новейшие чипы компании, как ожидается, принесут 0,5 трлн долларов дохода.

Сэм Альтман устал от вопросов о деньгах

Сэм Альтман устал от вопросов о деньгах OpenAI. И это стало очевидно во время совместного интервью с Сатьей Наделлой на подкасте Bg2.