Исследователи OpenAI и Anthropic раскритиковали безопасность xAI
Исследователи из OpenAI, Anthropic и других организаций публично раскритиковали культуру безопасности в компании xAI, принадлежащей Илону Маску. Назвав её “безрассудной” и “совершенно безответственной”.
Волна критики последовала за серией скандалов, связанных с чат-ботом Grok. Сначала он выдавал антисемитские комментарии и называл себя “МехаГитлером”. Затем xAI запустила более мощную модель Grok 4, которая, как выяснилось, использует личные политические взгляды Илона Маска при ответах на спорные вопросы. В последнем случае компания выпустила компаньонов в виде сексуализированной аниме-девушки и агрессивной панды.
Боаз Барак, профессор компьютерных наук из Гарварда, работающий над исследованиями безопасности в OpenAI, особенно критикует решение xAI не публиковать системные карты. Стандартные для отрасли отчёты о методах обучения и оценках безопасности.
Самуэль Маркс, исследователь безопасности искусственного интеллекта из Anthropic, также раскритиковал отсутствие отчёта о безопасности. Назвав этот шаг “безрассудным”. По его словам, хотя у практик OpenAI, Anthropic и Google есть свои проблемы, эти компании хотя бы оценивают безопасность перед развёртыванием и документируют результаты.
Неизвестно, что именно xAI сделала для тестирования Grok 4. Согласно анонимному исследователю, эта модель не имеет значимых ограничений безопасности. И эти слова могут означать всё, что угодно.