Исследователи OpenAI и Anthropic раскритиковали безопасность xAI

Исследователи из OpenAI, Anthropic и других организаций публично раскритиковали культуру безопасности в компании xAI, принадлежащей Илону Маску. Назвав её “безрассудной” и “совершенно безответственной”.

Волна критики последовала за серией скандалов, связанных с чат-ботом Grok. Сначала он выдавал антисемитские комментарии и называл себя “МехаГитлером”. Затем xAI запустила более мощную модель Grok 4, которая, как выяснилось, использует личные политические взгляды Илона Маска при ответах на спорные вопросы. В последнем случае компания выпустила компаньонов в виде сексуализированной аниме-девушки и агрессивной панды.

Боаз Барак, профессор компьютерных наук из Гарварда, работающий над исследованиями безопасности в OpenAI, особенно критикует решение xAI не публиковать системные карты. Стандартные для отрасли отчёты о методах обучения и оценках безопасности.

Самуэль Маркс, исследователь безопасности искусственного интеллекта из Anthropic, также раскритиковал отсутствие отчёта о безопасности. Назвав этот шаг “безрассудным”. По его словам, хотя у практик OpenAI, Anthropic и Google есть свои проблемы, эти компании хотя бы оценивают безопасность перед развёртыванием и документируют результаты.

Неизвестно, что именно xAI сделала для тестирования Grok 4. Согласно анонимному исследователю, эта модель не имеет значимых ограничений безопасности. И эти слова могут означать всё, что угодно.