Post Thumbnail

Anthropic готовит новый Claude Opus с «экстремальными рассуждениями»

Компания Anthropic готовится представить обновлённую линейку своих моделей искусственного интеллекта. По данным издания The Information, в ближайшие недели мы увидим возвращение модели Claude Opus. Напомню, что в прошлых релизах приставка Opus указывала на самую мощную версию, а Sonnet — на среднюю по возможностям.

Новые модели будут оснащены продвинутым режимом рассуждений, который специалисты называют «экстремальными рассуждениями». Главная особенность этого режима заключается в циклическом принципе работы. Модель будет самостоятельно переключаться между этапами мышления и использования внешних инструментов. Процесс выглядит так. Сначала модель обдумывает задачу, затем при необходимости обращается к инструментам, таким как интерпретатор кода или поисковые системы. После чего анализирует полученные результаты и снова возвращается к инструментам.

Эта архитектура напоминает принцип работы агентов искусственного интеллекта и сближает новые модели Claude с моделями o3 и o4-mini от OpenAI. Важно отметить, что модель сможет самостоятельно определять, когда ей нужно переключаться между режимом глубоких рассуждений и использованием внешних инструментов.

И вот такое внедрение циклической модели «размышление-действие» в массовые продукты Anthropic может создать новый стандарт для всей индустрии. Потенциально ускорив развитие полноценных автономных агентов искусственного интеллекта на 1-2 года раньше общепринятых прогнозов.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Открытая модель RoboBrain 2.0 станет основой для гуманоидных роботов

Модель искусственного интеллекта RoboBrain 2.0 теперь может объединять восприятие окружения и управлять роботами в 1 компактной системе. Специалисты уже называют её основой для будущего поколения гуманоидных роботов.

Tinder запустил двойные свидания: ИИ подбирает команды из 4 человек

Приложение Tinder запустило функцию двойных свиданий, которая позволяет пользователям объединяться с друзьями для поиска пар. Теперь можно пригласить до 3 друзей и вместе просматривать профили других так называемых команд. У которых есть хотя бы 1 совпадение в индивидуальных предпочтениях.

Новый бенчмарк показал провал ИИ в олимпиадных задачах по программированию

Появился новый бенчмарк LiveCodeBench Pro для оценки способностей искусственного интеллекта в программировании. Ссылка в описании. Он включает самые сложные и свежие задачи с популярных соревнований. Международной олимпиады по информатике и чемпионата мира по программированию. Задачи размечали сами победители и призёры этих соревнований.

Данные до 2022 года стали "доядерной сталью" для обучения ИИ

Искусственный интеллект, призванный стать локомотивом технологического прогресса, начинает тормозить собственное развитие. По данным издания The Register, генеративные модели заполнили интернет таким количеством синтетического контента, что это создаёт настоящий технологический тупик.

Сэм Альтман раскрыл попытки Meta переманить сотрудников за $100 млн

Сэм Альтман публично раскрыл беспрецедентную охоту за талантами, которую ведёт Марк Цукерберг. Глава Meta предлагает сотрудникам OpenAI поистине астрономические суммы. 100 млн долларов только в качестве входного бонуса!