ИИ от Google набрал 130 баллов IQ, но это ничего не значит

Post Thumbnail

Gemini 3 Pro стал первым искусственным интеллектом, достигшим IQ 130. И это одновременно впечатляет и ничего не значит.

Превью-версия набрала 130 баллов в оффлайн-бенчмарке Mensa. Специальной версии знаменитого теста на IQ, адаптированного для оценки искусственного интеллекта. Задачи написаны заново и не раскрываются, чтобы модели не могли на них дообучиться. Моделям с компьютерным зрением тест показывают картинками, остальным объясняют текстом.

Gemini 3 Pro оторвался на 4 балла от предыдущего лидера Grok 4 Heavy из 300-долларовой подписки. Где над задачей работают сразу несколько версий модели. Далее идут Claude Opus 4 и 1, GPT-5 Thinking и GPT-5 Pro.

Любопытная деталь, но в классическом Mensa Norway все лидирующие модели показывают более высокие результаты. Это значит, что хотя бы часть задач из теста попала в их обучающие корпуса. Средний человеческий уровень IQ равен 100 баллам, а результат Gemini 3 Pro оказывается среди 2 процентов лучших людей по оффлайн-тесту.

Но вот что действительно важно. Автор оффлайн-бенчмарка Максим Лотт прямо предупреждает: его графики не означают «победу машин над людьми». Он измеряет очень узкий навык — умение разгадывать абстрактные матрицы по картинкам.

А в реальной жизни интеллект гораздо шире: здравый смысл, интуиция, мотивация, опыт, ответственность. И здесь у людей пока нет конкурентов. Искусственный интеллект научился щёлкать головоломки лучше 98 процентов людей. Но это всё ещё не делает его умнее человека.

Почитать из последнего
ИИ для рекрутёров решал судьбу соискателей втайне от них
Представьте: вы опытный специалист с 10-летним стажем, отправляете резюме в компанию. И тишина. Даже на собеседование не позвали. Причина? ИИ поставил вам невидимую оценку и слил в архив. Добро пожаловать в новую реальность.
Сэм Альтман хвастается ростом, а реклама в ChatGPT уже на носу
Глава OpenAI Сэм Альтман радостно рапортует сотрудникам о том, что ChatGPT снова набирает обороты. Уже больше 10% роста ежемесячно, 800 миллионов человек еженедельно, всё прекрасно. Но за этими бодрыми цифрами скрывается интересная история. Про то, как компания буквально пару месяцев назад объявляла «красный код» и замораживала проекты, чтобы судорожно улучшать свой чатбот. Видимо, конкуренция кусается настолько сильно, что даже лидер рынка начинает нервничать.
ИИ не облегчает работу, он превращает людей в трудоголиков
8 месяцев наблюдений за технологической компанией на 200 сотрудников — и исследователи UC Berkeley пришли к неожиданному выводу. ИИ не разгружает людей, он заставляет их вкалывать ещё больше. Причём добровольно и с энтузиазмом.
Anthropic случайно создала идеального корпоративного психопата
Anthropic выпустила документ на 212 страниц о своей новейшей модели Opus 4.6, и там творится настоящий детектив. Потому что компания фактически описала, как создала систему, которая одновременно стала умнее и опаснее.
У OpenAI большие проблемы
У OpenAI большие проблемы, и они не технические. Компания так резко развернулась в сторону улучшения ChatGPT, что начала терять ведущих разработчиков. Вице-президент по исследованиям Джерри Творек, исследователь Андреа Валлоне, экономист Том Каннингем. И список растёт. 10 нынешних и бывших сотрудников рассказали 1 и ту же историю. Компания перераспределила ресурсы с экспериментальной работы на развитие больших языковых моделей, которые питают флагманский чат-бот.