Post Thumbnail

Угрозы и $1 трлн не улучшают работу нейросетей

Вы наверняка видели эти “секретные трюки” для управления нейросетями. Такие как угрозы, обещания наград, эмоциональные манипуляции. Но работают ли они на самом деле? Исследователи из Пенсильванского университета и Уортонской школы бизнеса провели масштабный эксперимент с 5 передовыми моделями: Gemini 1.5 Flash, Gemini 2.0 Flash, GPT-4o, GPT-4o-mini и GPT o4-mini.

Каждой модели задавали вопросы PhD-уровня по естественным наукам и сложные инженерные задачи. Для исключения случайных колебаний каждый запрос повторялся 25 раз.

Результаты оказались интересными! Ни 1 из 9 манипулятивных техник не показала статистически значимого улучшения точности ответов. Ни угрозы “пнуть щенка”, ни обещания $1 трлн, ни душещипательные истории о больной маме не помогли моделям давать более качественные ответы!

Более того, эти “трюки” сделали результаты менее стабильными. В некоторых случаях точность возрастала на 36 процентных пунктов, а в других падала на 35! Зафиксированы даже случаи, когда модель полностью игнорировала основной вопрос, “залипая” на манипулятивной части промпта.

Вместо сомнительных уловок исследователи рекомендуют по-настоящему эффективную стратегию. Чёткая формулировка задачи, конкретизация желаемого формата ответа и предоставление релевантного контекста.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
Глава Nvidia считает, что ИИ-пузыря - нет

Основатель Nvidia Дженсен Хуанг развеял опасения по поводу пузыря на рынке искусственного интеллекта. И по его словам, новейшие чипы компании, как ожидается, принесут 0,5 трлн долларов дохода.

Сэм Альтман устал от вопросов о деньгах

Сэм Альтман устал от вопросов о деньгах OpenAI. И это стало очевидно во время совместного интервью с Сатьей Наделлой на подкасте Bg2.

Число вакансий инженеров передового развёртывания выросло на 800%

Компании искусственного интеллекта придумали новую профессию. Речь об инженерах передового развёртывания.

OpenAI обещает создать полноценного учёного на ИИ к 2028 году

OpenAI пообещала создать полноценного учёного на основе искусственного интеллекта к 2028 году. Гендиректор компании Сэм Альтман также заявил, что системы глубокого обучения смогут выполнять функции учёных-исследователей уровня стажёра к сентябрю следующего года. А уровень автономного полноценного исследователя на искусственном интеллекте может быть достигнут уже к 2028 году.

Рабочие места для молодых айтишников в Британии рухнули на 46%

Знаете, что происходит на рынке труда для молодых айтишников в Великобритании? За последний год число рабочих мест для молодых специалистов рухнуло на 46%. И прогнозируется падение ещё на 53%, сообщает The Register. Со ссылкой на статистику Института студенческого трудоустройства.