Post Thumbnail

OpenAI выпустила o3 Pro — аналитический ИИ превзошедший Claude и Gemini

Компания OpenAI официально выпустила принципиально новую модель искусственного интеллекта o3 Pro. Её уникальность в том, что это не собеседник, а мощнейший аналитический инструмент. Представьте: вы загружаете контекст, формулируете задачу и получаете детальный, глубоко проработанный отчет. 1 из тестировщиков поделился поразительным опытом. Загрузив историю планерок своего стартапа, они получили настолько точные и обоснованные рекомендации, что полностью пересмотрели стратегию развития компании.

Модель демонстрирует впечатляющее понимание контекста, точно определяет подходящие инструменты и моменты их применения. Однако без достаточного объема входных данных склонна к чрезмерному анализу даже простейших задач. Своеобразный “перфекционизм” искусственного интеллекта.

В сравнительных тестах o3 Pro превосходит конкурентов Claude Opus и Gemini 2.5 Pro. В бенчмарках AIME модель превзошла Gemini 2.5 Pro, а в тесте GPQA Diamond на знание науки уровня PhD обошла недавно выпущенный Claude 4 Opus.

Кажется OpenAI делает стратегическую ставку на развитие способностей к рассуждению. Обучая модели не просто использовать доступные инструменты, но и понимать оптимальные сценарии их применения.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Новое партнёрство Anthropic и Canva: дизайн без дизайнера

Компания Anthropic представила обновление для своего помощника Claude. Который теперь умеет создавать и редактировать проекты прямо в популярной платформе Canva.

Hertz внедрила ИИ для поиска царапин на арендованных автомобилях

Искусственный интеллект теперь фиксирует каждую царапину на арендованных в автопрокате машинах! Компания Hertz внедрила инновационную систему сканирования, разработанную UVeye, которая уже работает в 6 пунктах аэропортов США.

Как Meta борется за таланты в сфере искусственного интеллекта

Марк Цукерберг попытался опровергнуть распространённое мнение о том, что исследователи массово переходят в его новое подразделение Superintelligence Labs исключительно из-за высоких зарплат. Он считает, что медиа упускают главное в этой истории.

Как старая консоль Atari заставила современный ИИ сдаться без боя

Супермощная Google Gemini отказалась играть в шахматы с консолью Atari 1977 года выпуска. Испугавшись поражения от устаревшей техники.

Зарплата до $170 тыс.: что предлагает SpaceX разработчикам ИИ

SpaceX делает неожиданный поворот в своей технологической стратегии. Компания Илона Маска открыла вакансии для инженеров-программистов в сфере искусственного интеллекта. Формируя команду, которая займётся решением сложнейших задач обработки данных для ракет-носителей и космических аппаратов.