ИИ от Google набрал 130 баллов IQ, но это ничего не значит

Post Thumbnail

Gemini 3 Pro стал первым искусственным интеллектом, достигшим IQ 130. И это одновременно впечатляет и ничего не значит.

Превью-версия набрала 130 баллов в оффлайн-бенчмарке Mensa. Специальной версии знаменитого теста на IQ, адаптированного для оценки искусственного интеллекта. Задачи написаны заново и не раскрываются, чтобы модели не могли на них дообучиться. Моделям с компьютерным зрением тест показывают картинками, остальным объясняют текстом.

Gemini 3 Pro оторвался на 4 балла от предыдущего лидера Grok 4 Heavy из 300-долларовой подписки. Где над задачей работают сразу несколько версий модели. Далее идут Claude Opus 4 и 1, GPT-5 Thinking и GPT-5 Pro.

Любопытная деталь, но в классическом Mensa Norway все лидирующие модели показывают более высокие результаты. Это значит, что хотя бы часть задач из теста попала в их обучающие корпуса. Средний человеческий уровень IQ равен 100 баллам, а результат Gemini 3 Pro оказывается среди 2 процентов лучших людей по оффлайн-тесту.

Но вот что действительно важно. Автор оффлайн-бенчмарка Максим Лотт прямо предупреждает: его графики не означают «победу машин над людьми». Он измеряет очень узкий навык — умение разгадывать абстрактные матрицы по картинкам.

А в реальной жизни интеллект гораздо шире: здравый смысл, интуиция, мотивация, опыт, ответственность. И здесь у людей пока нет конкурентов. Искусственный интеллект научился щёлкать головоломки лучше 98 процентов людей. Но это всё ещё не делает его умнее человека.

Почитать из последнего
Беспилотный робомобиль Waymo сбил ребёнка у школы
Беспилотный автомобиль Waymo, принадлежащий Alphabet, сбил ребёнка возле начальной школы в Калифорнии. Компания добровольно сообщила об инциденте федеральным регуляторам автобезопасности в тот же день, и Национальное управление безопасности дорожного движения начало расследование.
Создатели ИИ-министра для борьбы с коррупцией украли 7 млн евро
Помните историю про ИИ-министра в Албании? Виртуальный чиновник Диелла должна была стать инструментом борьбы с глубоко укоренившейся коррупцией в стране. Звучало прогрессивно и технологично. Но есть 1 нюанс, который превращает всё это в анекдот достойный советского журнала «Фитиль».
OpenAI закрывает модель GPT-4o навсегда и уже очень скоро
OpenAI объявила, что 13 февраля этого года удалит несколько моделей из ChatGPT, включая GPT-4o. Которую обожают пользователи за тёплый разговорный стиль. Компания запустила GPT-4o в мае 24 года, и модель стала чрезвычайно популярна среди платных подписчиков.
Молчаливый тиктокер с покерфейсом продал свою компанию за 900 миллионов
Хаби Лейм – это такой молчаливый тиктокер с покерфейсом и 160 миллионами подписчиков. И вот он продал свою компанию за $900 миллионов. Сумма огромная, но нюанс в том, что это за продажа. Фишка в условиях контракта - это создание искусственного аватара, который будет вести стримы, сниматься в рекламе и продавать товары 24 часа в сутки. Пока настоящий Хаби спит или играет, его цифровая копия будет вкалывать в другом часовом поясе.
Гуманоиды работают в три раза хуже людей
Знаете, что объединяет хайп вокруг гуманоидов и реальность? Ничего. Но некоторые паникуют из-за того, что гуманоиды массово заменят людей на заводах. И тут директор китайской компании UBTech Майкл Там взял и честно признался Financial Times. Их новейшие человекоподобные роботы достигают производительности всего в 30-50% от человеческой. И это только в простейших операциях типа складывания коробок или контроля качества. Грубо говоря, 1 работник человек делает столько же, сколько 2-3 робота вместе взятых.