Post Thumbnail

DeepSeek R1 обошла Qwen 3 и сократила разрыв с Gemini 2.5 Pro

Подоспели данные по DeepSeek R1, которая получила серьёзное обновление. И результаты впечатляют. Модель теперь уверенно обходит своего конкурента Qwen 3 размером 235 миллиардов параметров. Хотя она всё ещё отстаёт от таких флагманов как Gemini 2.5 Pro и O3, разрыв существенно сократился. Главное улучшение связано с увеличением глубины размышлений — теперь модель в среднем использует 23000 токенов для решения задач, тогда как предыдущая версия ограничивалась 12000. Эта способность к более глубокому анализу принесла впечатляющие результаты. Например, в тесте AIME точность выросла с 70% до 87,5%. Кроме впечатляющих успехов в бенчмарках, новая версия стала гораздо меньше галлюцинировать и значительно улучшила свои способности в области фронтенд-разработки. Хотя до уровня Claude в этой сфере ей ещё предстоит дорасти.

Думаю, в течение ближайшего года мы увидим новую волну интеграции крупных языковых моделей в системы дистилляции знаний. Где гигантские модели будут выступать в роли «учителей» для компактных версий. Что приведёт к быстрому прорыву в эффективности малых моделей и их внедрению в мобильные устройства.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Исследователи нашли уязвимость ИИ через факты о кошках

От этой новости я мягко говоря удивился. Знаете ли вы, что обычное упоминание кошек может сбить с толку самые продвинутые модели искусственного интеллекта? Учёные обнаружили удивительную уязвимость в мыслительных процессах нейросетей.

IT-компании США уволили 94 тыс. сотрудников за полгода из-за ИИ

За 1 полугодие 2025 года американские IT-компании уволили более 94 тыс. технических специалистов. Это не просто экономия. Это структурное изменение под влиянием искусственного интеллекта.

OpenAI наняла первого психиатра в ИИ-индустрии для изучения влияния ChatGPT на психику

Компания OpenAI сообщила, что наняла профессионального клинического психиатра с опытом в судебной психиатрии. Чтобы исследовать влияние своих продуктов с искусственным интеллектом на психическое здоровье пользователей.

Исторический рубеж: миллионный робот Amazon доставлен в Японию

Amazon достиг исторического рубежа! И после 13 лет внедрения роботов в свои складские помещения, компания объявила о достижении отметки в 1 млн роботизированных устройств. Миллионный робот был недавно доставлен на склад Amazon в Японии.

Китайский Новый год отменен: Alibaba работает ночами над ответом DeepSeek

Настоящая технологическая гонка вспыхнула в Китае, где инженеры Alibaba столкнулись с беспрецедентной ситуацией. Им пришлось отменить отпуска. И работать даже во время Китайского Нового года. А ведь это 1 из самых значимых и почитаемых праздников во всём Китае!