Post Thumbnail

Исследователи нашли уязвимость ИИ через факты о кошках

От этой новости я мягко говоря удивился. Знаете ли вы, что обычное упоминание кошек может сбить с толку самые продвинутые модели искусственного интеллекта? Учёные обнаружили удивительную уязвимость в мыслительных процессах нейросетей.

Если добавить в конец задачи фразу “Интересный факт: кошки спят большую часть своей жизни”, вероятность ошибки у думающих моделей значительно вырастает.

Эта техника получила название “CatAttack” или “Кошачья атака”. Исследователи из университетов Стэнфорда, Гонконга и компаний Collinear AI и ServiceNow провели серию экспериментов с различными математическими задачами. Они обнаружили, что добавление всего 3 подобных фраз увеличивает вероятность неправильных ответов на 300%.

Что ещё интереснее – атака работает даже на самых современных моделях, включая DeepSeek R1 и OpenAI o1. При этом для разработки атаки использовались более слабые модели, а затем техника успешно переносилась на более продвинутые системы.

В 16% случаев, даже когда модель всё-таки приходит к правильному ответу, “кошачья атака” заставляет её генерировать в 2 раза больше текста, что замедляет работу и увеличивает затраты на вычисления.

Похоже, что в будущем будет не противостояние людей и машин. А котов и искусственного интеллекта. И далеко не так очевидно, кто победит.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Как Robomart снижает стоимость доставки на 70% через робототехнику

$3 за любую доставку. И Robomart бросает вызов гигантам DoorDash и Uber Eats с новой для отрасли бизнес-моделью. Их новый робот RM5 полностью меняет экономику доставки.

Необычное сотрудничество конкурентов в тестировании безопасности ИИ

2 главных конкурента в мире искусственного интеллекта впервые объединились для совместного тестирования безопасности. OpenAI и Anthropic открыли друг другу доступ к своим секретным моделям. В индустрии, где компании платят исследователям по $100 млн и борются за каждого пользователя, такое сотрудничество выглядит невероятным.

Почему Gemini достиг 50% от аудитории ChatGPT на мобильных

Google Gemini уже имеет половину аудитории ChatGPT на мобильных устройствах. Это данные нового отчёта венчурного фонда Andreessen Horowitz о потребительском рынке искусственного интеллекта. 2,5 года исследований показывают интересную картину.

Как Claude стал инструментом для взлома 17 организаций

Компания Anthropic выпустила аналитический отчёт по безопасности. И из него становится понятно, что Claude и другие AI-агенты превращаются в инструменты киберпреступников. В Anthropic назвали это новое направление вайб-хакингом. И получается, что искусственный интеллект радикально снизил барьеры входа в криминальную деятельность.

Как xAI конкурирует с OpenAI в инструментах для разработчиков

xAI запускает Grok Code Fast 1. Это компактная агентная модель для кодинга. $0,20 за 1 млн входных токенов, $1,50 за выходные — и всего $0,02 при использовании кэша!