Post Thumbnail

OpenAI выпустила o3 Pro — аналитический ИИ превзошедший Claude и Gemini

Компания OpenAI официально выпустила принципиально новую модель искусственного интеллекта o3 Pro. Её уникальность в том, что это не собеседник, а мощнейший аналитический инструмент. Представьте: вы загружаете контекст, формулируете задачу и получаете детальный, глубоко проработанный отчет. 1 из тестировщиков поделился поразительным опытом. Загрузив историю планерок своего стартапа, они получили настолько точные и обоснованные рекомендации, что полностью пересмотрели стратегию развития компании.

Модель демонстрирует впечатляющее понимание контекста, точно определяет подходящие инструменты и моменты их применения. Однако без достаточного объема входных данных склонна к чрезмерному анализу даже простейших задач. Своеобразный “перфекционизм” искусственного интеллекта.

В сравнительных тестах o3 Pro превосходит конкурентов Claude Opus и Gemini 2.5 Pro. В бенчмарках AIME модель превзошла Gemini 2.5 Pro, а в тесте GPQA Diamond на знание науки уровня PhD обошла недавно выпущенный Claude 4 Opus.

Кажется OpenAI делает стратегическую ставку на развитие способностей к рассуждению. Обучая модели не просто использовать доступные инструменты, но и понимать оптимальные сценарии их применения.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
Сэм Альтман обещает вернуть человечность в ChatGPT

Глава OpenAI Сэм Альтман сделал заявление после того, как прошли многочисленные оффлайн и онлайн протесты против отключения модели GPT-4о. А потом включение, но с диким маршрутизатором. Я рассказывал про это на прошлой неделе максимально подробно. Прямая цитата главы OpenAI.

ИИ оживает: почему сооснователь Anthropic боится своего творения

Сооснователь Anthropic Джек Кларк опубликовал эссе, от которого становится не по себе. Он написал про природу современного искусственного интеллекта, и его выводы звучат как предупреждение.

Скандал на форуме Cursor: агентный ИИ — это маркетинг, а не магия

На форуме Cursor разгорелся настоящий скандал. Пользователи массово жалуются: весь этот хайп вокруг агентного искусственного интеллекта — чистый маркетинг. А не магия, которую нам обещали.

Google похоронила идею всемогущего ИИ-доктора

Компания Google выпустила отчёт про Health AI Agents на 150 страниц. Это 7 тыс аннотаций, более 1100 часов работы экспертов. Ссылка в описании. Цифры впечатляющие, да. Но суть не в метриках. Суть в том, что они похоронили саму идею всемогущего доктора на искусственном интеллекте. И это, пожалуй, самое честное, что произошло в этой индустрии за последнее время.

Подростки в TikTok пугают родителей фейковыми бродягами из ИИ

Знаете, что сейчас считается весёлым розыгрышем у подростков? Отправить родителям фото бездомного бродяги в их собственной гостиной. Искусственный интеллект нарисует, TikTok одобрит, а родители пусть истерику бьют. Вот такая забава пошла гулять по соцсетям.