DeepSeek R1 после минорного обновления приблизилась к уровню OpenAI o3
Компания DeepSeek выпустила обновление для своей языковой модели R1. Несмотря на то, что разработчики назвали его “минорным”, многие пользователи отмечают существенные улучшения. Сообщают, что рассуждения модели стали заметно глубже и продолжительнее, приблизившись к уровню O3 от OpenAI – одной из самых мощных моделей на рынке.
Просто нет слов! В сети даже появились скриншоты, где модель демонстрирует непрерывные рассуждения дольше 20 минут. Ну что, это значительный скачок в производительности. Объявление об обновлении было сделано через официальный аккаунт компании в китайской социальной сети WeChat, а протестировать новые возможности можно уже сейчас на официальном сайте deepseek.com.
Пока нет официальных тестов производительности, которые могли бы подтвердить заявления пользователей о достижении уровня O3. Но сообщество экспертов уже с нетерпением ждёт публикации бенчмарков, чтобы получить оценку нового обновления. Если слухи подтвердятся, и DeepSeek R1 действительно достигла производительности, сравнимой с O3 от OpenAI, это реально круто. Я думаю, что если R1 после простого обновления приблизилась к уровню O3, то будущая версия DeepSeek R2 может открыть эру по-настоящему “думающих” систем, способных поддерживать глубокий анализ на уровне, сравнимом с человеческими экспертами. Волнительно и тревожно.
Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
UBTech отправит роботов Walker S2 служить на границу Китая за $37 млнКитайская компания UBTech выиграла контракт на $37 миллионов. И отправит человекоподобных роботов Walker S2 служить на границу Китая с Вьетнамом. South China Morning Post сообщает, что роботы будут взаимодействовать с туристами и персоналом, выполнять логистические операции, досматривать грузы и патрулировать местность. И что характерно — они умеют самостоятельно менять свою батарею.
ИИ-чатботы генерируют контент, усугубляющий расстройства питанияСовместное исследование Стэнфордского университета и Центра демократии и технологий показало тревожную картину. Чат-боты с искусственным интеллектом представляют серьёзный риск для людей с расстройствами пищевого поведения. Учёные предупреждают, что нейросети раздают вредные советы о диетах. Предлагают способы скрыть расстройство и генерируют "вдохновляющий контент для похудения", который усугубляет проблему.
OpenAGI выпустил модель Lux, которая обгоняет Google и OpenAIСтартап OpenAGI выпустил модель Lux для управления компьютером и заявляет, что это прорыв. По бенчмаркам модель на целое поколение обгоняет аналоги от Google, OpenAI и Anthropic. Кроме того, она работает быстрее. Примерно 1 секунда на шаг вместо 3 секунд у конкурентов. И в 10 раз дешевле по стоимости обработки 1 токена.