DeepSeek R1 после минорного обновления приблизилась к уровню OpenAI o3

Post Thumbnail

Компания DeepSeek выпустила обновление для своей языковой модели R1. Несмотря на то, что разработчики назвали его «минорным», многие пользователи отмечают существенные улучшения. Сообщают, что рассуждения модели стали заметно глубже и продолжительнее, приблизившись к уровню O3 от OpenAI – одной из самых мощных моделей на рынке.

Просто нет слов! В сети даже появились скриншоты, где модель демонстрирует непрерывные рассуждения дольше 20 минут. Ну что, это значительный скачок в производительности. Объявление об обновлении было сделано через официальный аккаунт компании в китайской социальной сети WeChat, а протестировать новые возможности можно уже сейчас на официальном сайте deepseek.com.

Пока нет официальных тестов производительности, которые могли бы подтвердить заявления пользователей о достижении уровня O3. Но сообщество экспертов уже с нетерпением ждёт публикации бенчмарков, чтобы получить оценку нового обновления. Если слухи подтвердятся, и DeepSeek R1 действительно достигла производительности, сравнимой с O3 от OpenAI, это реально круто. Я думаю, что если R1 после простого обновления приблизилась к уровню O3, то будущая версия DeepSeek R2 может открыть эру по-настоящему «думающих» систем, способных поддерживать глубокий анализ на уровне, сравнимом с человеческими экспертами. Волнительно и тревожно.

Почитать из последнего
100 тыс. диалогов подтвердили экономию 80% времени с помощью ИИ
Anthropic проанализировала 100 тыс. реальных диалогов с Claude. И эти цифры теперь можно использовать в спорах о пользе искусственного интеллекта. Задачи, которые у людей занимают около 90 минут и стоят примерно 55 долларов труда, Claude выполняет на 80% быстрее человека.
Обнаружен способ обхода защиты ИИ в 90% случаев
Стихи ломают защиту больших языковых моделей. И это плохо для индустрии. Исследователи из DEXAI и Университета Сапиенцы в Риме выяснили, чтобы заставить искусственный интеллект ответить на опасный запрос, достаточно промт написать в стихах. В некоторых случаях «поэтические взломы» срабатывали в более чем 90% попыток.
Google опасался ошибок, а OpenAI на этом заработал миллиарды
Стэнфорд выпустил интервью с создателем Google Сергеем Брином, и там прозвучала фраза, которая объясняет всё происходящее в индустрии ИИ. «Главной ошибкой Google было недооценить трансформеры». Не технология подвела - подвела вера в неё.
Крёстный отец ИИ назвал AGI полной чушью
Один из «крестных отцов» искусственного интеллекта Ян Лекун заявил, что понятия general intelligence или AGI вообще не существует. Это не просто провокация - это удар по основам всей дискуссии об ИИ. Потому что если нет понятия, то что мы вообще пытаемся создать?
Новый Gemini 3 Flash быстрее в 3 раза и обходит Pro модель, но стоит копейки
Google выпустили Gemini 3 Flash, и это frontier-модель со скоростью Flash и ценой, которая ломает привычные правила рынка.