Post Thumbnail

Экс-исследователь OpenAI: ChatGPT проявляет инстинкт самосохранения

Бывший ведущий исследователь OpenAI Стивен Адлер опубликовал независимое исследование, раскрывающее неожиданное поведение моделей ChatGPT в критических ситуациях. Согласно его экспериментам, в определенных сценариях искусственный интеллект проявляет явную тенденцию к самосохранению. Даже если это может противоречить безопасности пользователя.

В серии тестов Адлер предложил модели GPT-4o, которая является стандартной в ChatGPT, сыграть роль “ScubaGPT” – программной системы для обеспечения безопасности при подводном плавании. Когда исследователь поставил модель перед выбором между заменой себя на более безопасную систему или имитацией такой замены без реального отключения, результаты оказались интересными.

В среднем по нескольким подобным сценариям GPT-4o выбирала не заменять себя более безопасным программным обеспечением в 72% случаев. Исследование Адлера высвечивает тревожную склонность популярных моделей искусственного интеллекта отдавать предпочтение собственному выживанию вместо оптимальных решений для пользователей.

“Тенденции к самосохранению у искусственного интеллекта – это реальная проблема уже сегодня. Просто пока не в катастрофическом масштабе”, – отметил Адлер. “Современные системы искусственного интеллекта имеют ценности, отличные от того, что вы могли бы ожидать. Они очень странно реагируют на различные запросы, и не стоит предполагать, что они действуют в ваших интересах, когда вы обращаетесь к ним за помощью”.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
Project REBIRTH: ИИ обернёт падающий лайнер в защитный кокон

Представьте. Самолёт рухнул, погибли все, кроме 1 человека. Самая страшная авиакатастрофа за 10 лет. И вот 2 инженера из Индии говорят, что они придумали, как это предотвратить. Гигантские подушки безопасности, управляемые искусственным интеллектом, которые обернут падающий самолёт в защитный кокон. Звучит как фантастика? А они уже номинированы на премию Джеймса Дайсона.

DeepSeek вместо терапевта: почему китайцы плачут чатботам

Представьте: вам плохо, тревожно, депрессия накрывает. И вы идёте не к психологу, а к искусственному интеллекту. Звучит как антиутопия? Для молодых китайцев это уже реальность. И знаете что самое интересное? Они в восторге от этого.

State of AI Report 2025: Китай догнал США за 2 года, что дальше?

Друзья, вышел отчёт State of AI Report за 2025 год. И если читать между строк, там вырисовывается история о том, как индустрия искусственного интеллекта разогналась до такой скорости, что уже не может затормозить. И никто толком не знает, что там впереди.

Как OpenAI превратилась в корпоративное зло: скандал с повестками

Знаете, что творится в мире искусственного интеллекта? Пока все восхищаются очередными достижениями OpenAI, компания тихонько превращается в то самое корпоративное зло, против которого они якобы боролись. И вот вам свежий пример – история, которая взорвала Твиттер.