DeepSeek выпустил 2 модели с прорывом в агентных системах и ИИ

Post Thumbnail

Китайский стартап DeepSeek выпустил 2 модели, которые претендуют на звание прорыва в агентных системах. И судя по метрикам, это не просто маркетинг.

DeepSeek-V3.2 — это официальный преемник экспериментальной версии. Доступна в приложении, на сайте и через API. DeepSeek-V3.2-Speciale — улучшенная версия с акцентом на продвинутое многошаговое рассуждение. Пока работает только через API.

Обе модели делают упор на глубокие цепочки рассуждений и поведение для агентных сценариев. Это планирование, решение задач, сложные выводы и работа со структурированными данными.

DeepSeek-V3.2-Speciale стала первой опенсорсной моделью, которая выбивает золото в топовых олимпиадах. Золото на 4 авторитетных олимпиадах!. По метрикам Speciale обходит Gemini 3.0 Pro на математике, а менее мощная DeepSeek-V3.2 опережает Claude-4.5 Sonnet в кодинге.

Но есть нюанс. Test-time compute огромен. Speciale совсем не экономит токены, так что инференс получается дорогой. Авторы сами признают, что «оставили оптимизацию на будущие исследования».

Технические причины успеха: это новая архитектура DeepSeek Sparse Attention, масштабный стабильный RL-тренинг и большой пайплайн для агентных задач. И это ключевое изменение архитектуры по сравнению с предыдущим поколением.

Обе модели чрезвычайно хороши во всяких агентских задачах, и особенно в поиске и задачах с браузером. Для этого сгенерировали 1800 синтетических сред, в которых агенты обучались выполнять совершенно разные задачи. Очень крутая модель получилась, респект.

Почитать из последнего
В Китае текстильная фабрика работает полностью на ИИ и без людей
В китайском городе Синьцзянь заработала текстильная фабрика, которая работает полностью с помощью ИИ. И вот вам картина будущего, в котором людям на производстве места нет. На огромном производстве ни одного рабочего на линии. Около 5000 ткацких станков крутятся круглосуточно под управлением ИИ и робототехники.
Психиатры зафиксировали десятки случаев, когда люди сходят с ума от ChatGPT
The Wall Street Journal пишет, что рост популярности чат-ботов на ИИ вызывает обеспокоенность психиатров, фиксирующих отдельные случаи расстройств на этой почве.
Similarweb показал, за счёт чего Gemini отжирает долю у OpenAI
Similarweb опубликовал свежую аналитику по доле разных продуктов на больших языковых моделях в веб-трафике. И вот вам картина перераспределения рынка. В начале года у ChatGPT было 87%, теперь — 68%. Доля упала почти на 20%.
Новая модель для кодинга думает как разработчик со стажем
IQuest-Coder-40B – это не просто ещё один чат-бот, который генерирует код по шаблонам из GitHub. Это новая open-source модель для кодинга с 40 миллиардами параметров. Которая обучалась совсем не так, как его конкуренты.
Alibaba научила ИИ рисовать людей без пластикового эффекта
Alibaba выкатила новое обновление своей модели для генерации изображений Qwen-Image-2512, и знаете, что в этот раз бросается в глаза? Они наконец-то решили главную проблему всех нейросетевых картинок. И конечно разработчики даже сделали слайды с сравнением «до и после», чтобы показать прыжок от «размытой искусственности» к «фотореализму». Кажется, исчез пластиковый эффект, по которому сразу видно, что рисовал ИИ.