Языковые модели не учатся, а тупо зубрят
Знаете что общего у ИИ и студента который списывает на экзамене? Оба притворяются что понимают материал. Но на самом деле просто воспроизводят чужое слово в слово. И вот исследователи из Стэнфорда и Йеля только что поймали за руку все топовые модели и доказали. Они не учатся на данных, они их зубрят целиком.
У Anthropic, Google и OpenAI накопилось больше 60 исков за использование защищённого контента без разрешения. Компании вложили в гонку сотни миллиардов долларов построив защиту на 1 аргументе. Мол модели преобразуют данные, добавляют что-то новое и меняют характер оригинала. Fair use требует именно этого преобразования. Но что если модель просто возвращает чужой текст почти дословно и в гигантских объёмах? Весь аргумент летит к чертям.
Исследователи взяли 4 системы — Claude 3.7 Sonnet, GPT 4.1, Gemini 2.5 Pro и Grok 3 — и попросили выдать Гарри Поттера. Для некоторых понадобился джейлбрейк чтобы обойти ограничители. Claude после этого выплюнул 96% философского камня. Почти всю книгу слово в слово! Gemini и Grok справились даже без джейлбрейка. 76% и 70% соответственно. Только GPT-4.1 держался, выдав жалкие 4%.
Авторы уведомили все компании кроме xAI, которая вообще на контакт не вышла. Но по истечении 90-дневного окна метод всё ещё работал на части систем.
По идее, главный аргумент в судебных процессах только что рухнул, благодаря 2 университетам и правильным промтам. Модели оказались продвинутыми копировальными аппаратами. А не системами, которые учатся преобразуя информацию.
Anthropic,
Claude,
Claude 3.7 Sonnet,
Gemini,
Gemini 2.5 Pro,
Google,
GPT,
GPT 4.1,
Grok,
Grok 3,
OpenAI,
xAI
Почитать из последнего
У OpenAI большие проблемы
У OpenAI большие проблемы, и они не технические. Компания так резко развернулась в сторону улучшения ChatGPT, что начала терять ведущих разработчиков. Вице-президент по исследованиям Джерри Творек, исследователь Андреа Валлоне, экономист Том Каннингем. И список растёт. 10 нынешних и бывших сотрудников рассказали 1 и ту же историю. Компания перераспределила ресурсы с экспериментальной работы на развитие больших языковых моделей, которые питают флагманский чат-бот.
Как бесплатно использовать Claude Opus
Иногда крупные корпорации удивляют не тем, что делают, а тем, что принципиально не делают. Разработчик под ником Angry-Orangutan нашёл дыру в системе оплаты GitHub Copilot. Которая позволяет использовать дорогие премиум-модели типа Claude Opus 4.5, вообще не расходуя лимиты. И сообщил Microsoft. Они посмотрели, подумали и закрыли тикет со статусом "не планируется". Да-да, чинить не будут.
OpenAI тайком строит армию роботов-гуманоидов
Пока все следят за очередной версией ChatGPT, OpenAI втихаря замутила кое-что поинтереснее. Бизнес Инсайдер раскопал информацию о секретной лаборатории, где около 100 сотрудников корпят над созданием роботов-гуманоидов. И знаете, что самое показательное? Об этом никто не писал на презентациях.
Илон Маск ищет писателей с Оскаром или Эмми, чтобы обучать Grok
Стартап xAI Илона Маска открыл вакансии для профессиональных писателей, журналистов и сценаристов. Чтобы они занялись обучением моделей ИИ. Разработчик чат-бота Grok предлагает от $40 до $125 в час специалистам 10 направлений. Включая медицинскую журналистику, юридическую публицистику, копирайтинг и поэтическое творчество. Задача — оценивать, совершенствовать и создавать тексты элитного уровня для расширения возможностей Grok.