Claude 4 Opus признан лучшим в мире для кодинга, обойдя Gemini и OpenAI o3

Post Thumbnail

Компания Anthropic представила 4 поколение искусственного интеллекта Claude. Я в приятном шоке! Новая линейка включает 2 модели — Opus 4 и Sonnet 4. Обе модели демонстрируют принципиально новый уровень работы с программированием и агентными задачами.

Claude Opus 4 позиционируется как лучшая в мире модель для работы с кодом. Главная особенность — способность поддерживать стабильную производительность при выполнении сложных длительных задач. Модель может непрерывно работать над одной задачей часами, сохраняя концентрацию на первоначальном контексте.

Claude Sonnet 4 представляет значительное обновление предыдущей версии 3.7. Модель показывает улучшенные способности в программировании и логическом мышлении, при этом более точно следует инструкциям пользователя.

Claude Sonnet можно попробовать бесплатно, а Opus уже с подпиской. Обе модели на 65% реже отказываются от выполнения комплексных задач по сравнению с предшественниками. Технологически модели поддерживают расширенное мышление — чередуют анализ с использованием инструментов веб-поиска и выполняют задачи параллельно.

Opus 4 демонстрирует глубокое понимание сложных кодовых баз, в то время как Sonnet 4 оптимизирован для повседневных программистских задач. GitHub уже тестирует интеграцию в своём продукте Copilot. Я попробовал уже обе модели и могу сказать, что новые модели работают точнее и быстрее. Где раньше было несколько попыток, сейчас всё намного быстрее и точнее. Я реально удивлен!!!

Claude 4 Opus и прямо сейчас — лучший в мире для кодинга, согласно бенчмарку SWE-bench и обошел как Gemini 2.5 Pro, так и OpenAI o3.

На презентации новых моделей директор Anthropic Дарио Амодеи также дал интересный прогноз, что уже в следующем году мы увидим появление компании стоимостью 1 миллиард долларов с 1 сотрудником и искусственным интеллектом.

Почитать из последнего
Канадцы создали робота, который делает маникюр за 20 минут
Канадский стартап Umia выпустил компактный аппарат для маникюра с ИИ. И это выглядит как издевательство над индустрией красоты. Принцип работы простой до безобразия: засовываешь палец внутрь, встроенная камера сканирует размеры и форму ногтя, затем машина наносит и закрепляет 3 слоя гель-лака. На каждый ноготь уходит примерно 1,5 минуты, а на весь процесс — не больше 20 минут.
Андрей Карпаты признался, что чувствует себя отстающим в мире ИИ
Бывший директор по ИИ Tesla и OpenAI Андрей Карпаты, выдал тут новый откровения. "Я никогда не чувствовал себя настолько отстающим как программист", — сообщил он. И далее, цитирую.
ChatGPT захватывает университеты США
OpenAI закрепилась во многих университетах США. Лицензии используют студенты, преподаватели и сотрудники. То есть практически все, кто имеет отношение к университету.
OpenAI ищет человека, который будет предотвращать апокалипсис от ИИ
OpenAI открыла вакансию Head of Preparedness. Главная идея роли: понимать, где ИИ может пойти не туда. Предотвращать злоупотребления, усиливать защиту кибербезопасности и закладывать правила для систем, которые умеют самоулучшаться.
В Китае открыли школу, где гуманоидов учат как на уроках труда
В Китае заработал учебный центр для гуманоидов. И это выглядит как издевательство над понятием "быстрое обучение". 2 этажа с воссозданными производственными линиями и домашними интерьерами. Роботы учатся сортировать катушки, упаковывать посылки, готовить еду и убирать спальню. Как на уроках труда, только дороже.