Учёные нашли идиотский способ улучшить ответы нейросетей

Post Thumbnail

Исследователи из Google случайно наткнулись на абсурдный лайфхак, который реально работает. Если повторять промпт дважды — то есть отправлять запрос не в виде обычного текста, а копировать его 2 раза подряд — качество ответов модели в 67% случаев статистически значимо улучшается.

Звучит как издевательство, но цифры не врут. Правда, есть 1 важный нюанс: это работает только для обычных моделей без цепочек рассуждений. С моделями, которые используют reasoning, эффект нейтральный или слегка положительный, так что применять смысла особо нет.

А теперь самое интересное — почему вообще это работает? Все мы уже выучили, что порядок токенов в промпте важен. И это потому, что большинство моделей обучаются каузально — то есть предыдущие токены не получают доступа к следующим. Тут та же логика. Грубо говоря, получается, что какие-то токены в промпте никогда не видят другие, а повторяя запрос, мы эту асимметрию устраняем — и качество растёт.

И вот тут начинается самое смешное. Авторы показывают, что количество генерируемых токенов от повтора промпта не растёт, как и задержка ответа. То есть лайфхак почти бесплатный.

Почему тогда для моделей с reasoning не подходит? Тут тоже есть объяснение. Просто они уже самостоятельно научились повторять промпт сами себе. Вы точно это замечали. То есть здесь ещё 1 повторение уже не даёт такого эффекта, а в случае с обычными моделями мы просто выносим этот трюк наружу.

Получается, самый тупой хак оказался рабочим.

Почитать из последнего
Биполярочка, паничка и нарциссический абьюз. Как Россия выучила психологический словарь - и забыла дойти до врача
Представьте обычный российский ужин. Мама говорит, что устала - дочь ставит ей диагноз «эмоциональное выгорание». Папа повысил голос - готово, он уже «абьюзер». Подруга не позвонила в день рождения - классический «газлайтинг». Ещё 10 лет назад всё это называлось просто жизнью. Теперь у каждой ссоры есть диагноз, у каждого неудобного человека - расстройство личности. И у половины офиса - «нарциссический абьюз» от начальника. Россия внезапно стала страной поголовных психологов. Только дипломов у них почему-то нет.
Учитель философии из Пекина предсказал Трампа, войну с Ираном и кое-что ещё. Последнее пока не сбылось
Май 2024 года. Небольшой класс в пекинской школе Moonshot Academy. Учитель философии и истории Цзян Сюэцинь рассказывает студентам о том, чего ещё не случилось. В США тогда всё ещё правил Байден, Трамп только-только пережил первое покушение, а война с Ираном казалась сюжетом голливудского триллера. Видео набрало несколько десятков просмотров и благополучно забылось.
Четыре блогера. Четыре смерти во время съёмки. Один и тот же мотив
Фуд-блогер с Филиппин Эмма Амит отправилась в мангровый лес, набрала ракушек и крабов, принесла домой, сварила и съела на камеру. Зрители увидели, как она долго варит добычу в кокосовом молоке - и берёт в руки яркого пятнистого краба.
Внутри ИИ нашли переключатель характера
Вы думали, что характер ИИ — это какая-то эфемерная штука из настроек? Anthropic только что опубликовала исследование "The Assistant Axis", которое разбивает эту иллюзию. Оказывается, личность нейросети — это буквально измеримая координата внутри её электронных мозгов, и с ней можно делать что угодно.
Нейросети стали слишком сложными и их изучают как живых существ
Большие языковые модели стали настолько сложными, что даже создающие их инженеры не понимают, как те работают. И отказались от математических методов и начали изучать нейросети как живые организмы. Наблюдают за поведением, отслеживают внутренние сигналы, строят карты функциональных областей. Именно так биологи изучают незнакомых существ, не предполагая упорядоченной логики.