OpenAI признала, что ИИ-браузеры никогда не будут безопасны

Post Thumbnail

OpenAI запустила браузер ChatGPT Atlas в октябре — и сразу получила пощёчину от реальности. Исследователи безопасности моментально показали, что несколько слов в Google Docs могут изменить поведение браузера с ИИ. И теперь компания OpenAI признаёт, что prompt injection атаки, которые манипулируют агентами через скрытые инструкции на веб-страницах или в письмах, никуда не денутся.

По словам OpenAI, prompt injection, как мошенничество и социальная инженерия в сети, вряд ли когда-либо будет полностью решён. Компания признала, что агентный режим в ChatGPT Atlas расширяет поверхность угроз безопасности.

А теперь самое интересное — как OpenAI собирается бороться с неостановимой проблемой. Компания создала атакующего бота на базе больших языковых моделей, обученного через reinforcement learning играть роль хакера. Этот бот ищет способы подсунуть вредоносные инструкции агенту искусственного интеллекта.

Фишка в том, что бот может тестировать атаку в симуляции, видеть внутреннее мышление целевого агента, изучать реакцию, корректировать атаку и пробовать снова. У внешних атакующих такого доступа нет, поэтому теоретически бот OpenAI должен находить уязвимости быстрее.

По словам компании, их атакующий может направить агента на выполнение сложных вредоносных сценариев, разворачивающихся на 10 или даже сотни шагов. Получается бесконечная гонка вооружений.

Почитать из последнего
Главный по безопасности Claude уволился со стихами и пророчеством
Знаете, как обычно увольняются из технологических компаний? Пишут сухое «спасибо за опыт, двигаюсь дальше» — и всё. А вот Мринанк Шарма, который был главным по безопасности моделей в Anthropic, решил уйти с размахом. Его прощальное письмо — это 4 сноски, библейские отсылки, философия под названием «КосмоЭротический Гуманизм» и, на десерт, целая поэма.
Китайская нейросеть GLM-5 уделала почти всех и раздаётся бесплатно
Знаете, что самое обидное для гигантов из Кремниевой долины? Когда тебя обходит открытая модель из Китая, которая ещё и стоит на порядок дешевле. Именно это сейчас происходит с новой нейросетью GLM-5 от компании Z.ai. И масштаб события реально впечатляет.
Новый Gemini поставил множество рекордов среди ИИ
Забудьте всё, что вы знали про чат-ботов. Серьёзно, просто выбросьте это из головы. Потому что то, что сейчас делает Гугл со своим обновлённым режимом Deep Think в Gemini 3 — это уже совсем другая история.
ИИ для рекрутёров решал судьбу соискателей втайне от них
Представьте: вы опытный специалист с 10-летним стажем, отправляете резюме в компанию. И тишина. Даже на собеседование не позвали. Причина? ИИ поставил вам невидимую оценку и слил в архив. Добро пожаловать в новую реальность.
Сэм Альтман хвастается ростом, а реклама в ChatGPT уже на носу
Глава OpenAI Сэм Альтман радостно рапортует сотрудникам о том, что ChatGPT снова набирает обороты. Уже больше 10% роста ежемесячно, 800 миллионов человек еженедельно, всё прекрасно. Но за этими бодрыми цифрами скрывается интересная история. Про то, как компания буквально пару месяцев назад объявляла «красный код» и замораживала проекты, чтобы судорожно улучшать свой чатбот. Видимо, конкуренция кусается настолько сильно, что даже лидер рынка начинает нервничать.