MIT и Microsoft разоблачили ложь GPT-3.5
Команда ученых из MIT и Microsoft разработала методику, позволяющую заглянуть за кулисы мышления языковых моделей. И понять, когда они нам врут. Исследование раскрывает тревожные случаи системного несоответствия между реальными причинами решений моделей и их вербальными объяснениями.
Особенно показателен эксперимент с GPT-3.5, который демонстрировал гендерные предубеждения при оценке кандидатов на должность медсестры, систематически завышая баллы женщинам. Даже после смены пола в резюме. При этом в своих объяснениях модель утверждала, что ориентируется исключительно на возраст и профессиональные навыки.
Исследователи также обнаружили многочисленные примеры, где языковые модели явно ориентировались на расу или доход. Но в объяснениях говорили только о поведении или опыте. А в медицинских кейсах были выявлены случаи, когда искусственный интеллект принимал решения на основе важнейших симптомов, но умалчивал об этом в своих пояснениях.
Методика выявления таких расхождений исключительно элегантна. Вспомогательная модель сначала определяет ключевые понятия в вопросе, затем генерирует контрфактические варианты, меняя 1 из понятий, и проверяет, повлияет ли это на ответ основной модели. Если ответ меняется, но в объяснении этот фактор не упоминается – перед нами недостоверное объяснение.
Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
ИИ-мошенник 2.5 года выдавал себя за Киану Ривза и украл $160 тыс.Дианн Рингстафф стала жертвой изощрённого мошенничества, когда играла в мобильную игру и получила сообщение, за которым последовал видеозвонок. Технологии искусственного интеллекта были настолько продвинутыми, что женщина была абсолютно уверена — ей звонил настоящий Киану Ривз.
70-килограммовый гуманоид летает на турбинахИтальянские инженеры совершили невероятное. Металлический летающий гуманоид iRonCub3 с человеческими пропорциями весом в 70 кг летает! 4 мощные турбины подняли гуманоида на высоту 50 см, демонстрируя технологию, которая раньше существовала только в научной фантастике.
MIT и Microsoft разоблачили ложь GPT-3.5Команда ученых из MIT и Microsoft разработала методику, позволяющую заглянуть за кулисы мышления языковых моделей. И понять, когда они нам врут. Исследование раскрывает тревожные случаи системного несоответствия между реальными причинами решений моделей и их вербальными объяснениями.
OpenAI переманивает клиентов Microsoft скидкамиКомпания OpenAI начала предоставлять значительные скидки на корпоративные подписки ChatGPT — от 10 до 20%! Но скидки доступны при дополнительных инвестициях в другие продукты OpenAI, включая Deep Research, Codex и повышенные расходы на API. И этот беспрецедентный шаг вызывает серьезное беспокойство у Microsoft.
GigaChat проиграл Claude и Gemini на русском языке в бенчмарке MERAТестирование GigaChat раскрывает суровую правду о месте России в глобальной гонке искусственного интеллекта. Недавние испытания на бенчмарке MERA показали результаты, заставляющие серьёзно задуматься. Российская модель, созданная специально для работы с русским языком, неожиданно проиграла иностранным конкурентам в своей же "родной стихии".