Anthropic отменила тест для найма, потому что ИИ всех обогнал

Post Thumbnail

Anthropic использует тестовое задание для найма performance-инженеров. Это оптимизация кода для вымышленного процессора, напоминающего GPU. Кандидатам давали 2 часа упаковывать векторы, распределять операции по ядрам и минимизировать такты симулированной машины. Лучшие инженеры выдавали около 1790 тактов за это время. А потом случилось то, что должно было случиться. Claude Opus 4.5 прошёл тот же тест и показал 1579 тактов. За те же 2 часа нейросеть обошла живых специалистов!

И теперь Anthropic открыла задание публично и предлагает всем желающим побить рекорд ИИ, обещая рассмотреть резюме победителей. Звучит как щедрость, но давайте посмотрим правде в глаза — это признание поражения человечества в конкретной профессиональной области. Более того, если дать Claude Opus 11.5 часов вместо 2, он добирается до 1487 тактов. Именно этот результат Anthropic называет планкой победы над ИИ.

Получается, Anthropic по сути говорит кандидатам, мол докажите, что вы лучше нашего продукта. Иначе зачем вы нам нужны? Репозиторий с симулятором, тестами и визуализатором доступен каждому. Вопрос остаётся открытым: это маркетинговый ход для демонстрации мощи Claude? Или признание, что эпоха, когда люди были незаменимы в оптимизации кода, закончилась? А если ChatGPT или DeepSeek лучше справится, они уволят Claude?

Почитать из последнего
Сотрудники ИИ-компаний “отравляют” обучение нейросетей
Проект с говорящим названием Poison Fountain предлагает владельцам сайтов кормить ботов ИИ специально испорченными данными. Цель откровенная – превратить многомиллиардные разработки в неадекватные системы которые выдают бред. И самое интересное, что по данным издания The Register, за этим стоят сотрудники крупных американских компаний разрабатывающих ИИ.
Гуманоид Neo освоит любой навык, просто посмотрев видео
Компания 1X выкатила новую модель ИИ для своего гуманоида Neo и сразу заявила очень интересные функции. Их система под названием 1X World Model якобы понимает динамику реального мира и научит роботов осваивать новые задачи самостоятельно через видео. Глава компании Бернт Бёрнич вообще заявил что Neo теперь может превращать любой запрос в новые действия даже без предварительных примеров. Звучит как магия правда?
Google выпустил медицинский ИИ, который видит то, что упускают врачи
Представьте ситуацию: врач смотрит на несколько снимков компьютерной томографии или КТ по очереди, пытаясь уловить изменения между срезами. Устаёт, теряет концентрацию, может пропустить детали. А теперь представьте систему, которая видит все снимки одновременно как единое целое. Именно это умеет новая MedGemma 1.5 от Google.
OpenAI предупредила инвесторов, что Маск будет нести откровенную чушь
OpenAI разослала письмо инвесторам и банковским партнёрам с предупреждением. Мол готовьтесь к тому, что Илон Маск будет делать намеренно абсурдные и привлекающие внимание заявления. Судебный процесс начнётся в апреле, и компания явно нервничает, раз заранее пытается застраховаться от репутационных рисков.
Сотни искусственных интеллектов создали браузер с нуля
Команда Cursor решила провести эксперимент, который звучит как научная фантастика. Они взяли сотни автономных кодинг-агентов, запустили их параллельно над одним проектом и дали работать неделями. Результат? Больше 1 миллиона строк кода. Вопрос был простой. Могут ли машины справиться с задачами, на которые у людей уходят месяцы?