OpenAI признала, что ИИ-браузеры никогда не будут безопасны

Post Thumbnail

OpenAI запустила браузер ChatGPT Atlas в октябре — и сразу получила пощёчину от реальности. Исследователи безопасности моментально показали, что несколько слов в Google Docs могут изменить поведение браузера с ИИ. И теперь компания OpenAI признаёт, что prompt injection атаки, которые манипулируют агентами через скрытые инструкции на веб-страницах или в письмах, никуда не денутся.

По словам OpenAI, prompt injection, как мошенничество и социальная инженерия в сети, вряд ли когда-либо будет полностью решён. Компания признала, что агентный режим в ChatGPT Atlas расширяет поверхность угроз безопасности.

А теперь самое интересное — как OpenAI собирается бороться с неостановимой проблемой. Компания создала атакующего бота на базе больших языковых моделей, обученного через reinforcement learning играть роль хакера. Этот бот ищет способы подсунуть вредоносные инструкции агенту искусственного интеллекта.

Фишка в том, что бот может тестировать атаку в симуляции, видеть внутреннее мышление целевого агента, изучать реакцию, корректировать атаку и пробовать снова. У внешних атакующих такого доступа нет, поэтому теоретически бот OpenAI должен находить уязвимости быстрее.

По словам компании, их атакующий может направить агента на выполнение сложных вредоносных сценариев, разворачивающихся на 10 или даже сотни шагов. Получается бесконечная гонка вооружений.

Почитать из последнего
Глава Boston Dynamics рассказал, когда гуманоиды придут в наши дома
Роберт Плейтер возглавляет Boston Dynamics и работает там с 1994 года. Больше 30 лет в 1 компании занимается роботами. И вот он дал интервью Business Insider где честно рассказал когда гуманоиды придут в ваш дом. Спойлер – не скоро.
Учёные превратили ИИ в инструмент для эксплуатации старых идей
Журнал Nature опубликовал исследование, которое разрывает шаблон о пользе ИИ для науки. Учёные проанализировали 41 миллион научных статей и обнаружили парадокс. Искусственный интеллект работает как турбина для личных карьер, но одновременно душит саму науку.
В TSMC проверили, есть ли на самом деле ИИ-пузырь
Представьте. Вы зарабатываете $122 миллиарда в год, производите чипы буквально для всех, от Apple до Nvidia. А также бьёте рекорды квартал за кварталом. И вдруг публично заявляете – мы очень нервничаем. Именно это сделал глава TSMC, компании, которая фактически держит на себе всю мировую электронику.
Что общего у ChatGPT и строительного экскаватора
Знаете, что общего у ChatGPT и строительного экскаватора? Казалось бы, ничего. Но вот легендарный производитель тяжёлой техники Caterpillar, внезапно стал 1 из бенефициаров бума ИИ. И речь тут совсем не о бульдозерах.
Google отказался от рекламы в Gemini, пока OpenAI отчаянно её запускает
К мнению, что никакой гонки нет. Знаете что случилось тут же после того как OpenAI объявила о запуске рекламы в ChatGPT? Вице-президент Google по глобальной рекламе Дэн Тейлор публично заявил. Мол у нас нет планов по размещению рекламы в приложении Gemini. Совпадение? Не думаю.