Post Thumbnail

Microsoft обнаружила уязвимости агентов ИИ к манипуляциям в симуляции

Microsoft создала симуляционную среду для тестирования агентов искусственного интеллекта — и обнаружила неожиданные слабости. Исследование, проведённое совместно с Университетом Аризоны, показало, что нынешние агентные модели уязвимы к манипуляциям.

Симуляционная среда получила название “Magentic Marketplace”. Типичный эксперимент выглядит так. Агент-клиент пытается заказать ужин согласно инструкциям пользователя, а агенты различных ресторанов конкурируют за заказ. В начальных экспериментах участвовали 100 агентов со стороны клиентов и 300 со стороны бизнеса.

Управляющий директор лаборатории AI Frontiers Lab в Microsoft Research Эсе Камар, объясняет важность таких исследований. Цитирую. “Действительно стоит вопрос, как изменится мир, когда эти агенты начнут сотрудничать, общаться друг с другом и вести переговоры. Мы хотим глубоко понять эти вещи”.

Исследование охватило ведущие модели, включая GPT-4 o, GPT-5 и Gemini-2.5-Flash, и обнаружило удивительные слабости. Исследователи нашли несколько техник манипуляции агентами-покупателями. Особенно заметным оказалось падение эффективности при увеличении количества опций.

“Мы хотим, чтобы эти агенты помогали обрабатывать множество вариантов”, говорит Камар. “И мы видим, что нынешние модели действительно перегружаются слишком большим количеством опций”. Агенты также столкнулись с проблемами при совместной работе над общей целью — модели не понимали, какой агент должен играть какую роль.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
Google обнаружила 3 вируса использующих ИИ для усиления атак

Google обнаружила 3 вируса нового поколения, которые тайно подключаются к моделям искусственного интеллекта для усиления атак. Об этом сообщило подразделение Google Threat Intelligence Group.

Microsoft обнаружила уязвимости агентов ИИ к манипуляциям в симуляции

Microsoft создала симуляционную среду для тестирования агентов искусственного интеллекта — и обнаружила неожиданные слабости. Исследование, проведённое совместно с Университетом Аризоны, показало, что нынешние агентные модели уязвимы к манипуляциям.

CodeClash показал огромный разрыв между ИИ и человеческим программистом

Представлен CodeClash. Это новый бенчмарк для оценки навыков программирования у больших языковых моделей. И он показал: разрыв с человеческим уровнем огромен.

Майкл Бэрри поставил 1,1 млрд долларов против Nvidia и Palantir

Майкл Бэрри - это легендарный инвестор, который предсказал ипотечный кризис 2008 года. И вот он снова делает громкий ход. Майкл поставил 1,1 млрд долларов в пут-опционах против 2 крупных компаний из сектора искусственного интеллекта. Это Nvidia и Palantir.

XPeng представила первого в мире робота-гуманоида женщину

Китайский производитель электромобилей XPeng представил робота-гуманоида нового поколения IRON. И это 1 женщина гуманоид!