Французский стартап представил альтернативу DeepSeek

Post Thumbnail

Mistral AI выпустили новое опенсорсное семейство моделей, и это не просто очередной релиз. 4 модели сразу: 3 компактных модели на 14, 8 и 3 млрд параметров плюс флагманская Mistral Large 3.

Mistral Large 3 обучали с нуля на 3 тыс. NVIDIA H200 GPU. Вполне приличный кластер. И это первая MoE-модель стартапа со времён знаменитой Mixtral. 675 млрд параметров, 41 млрд активных. По метрикам модель дотягивает до DeepSeek 3 и 1 и Kimi K2.

Отдельно хвастаются мультиязычностью. Заявляют, что на языках, кроме английского и китайского, их модель лучшая в своём классе. Плюс понимание изображений.

Mistral Small 3 выдаёт свыше 81% на MMLU. Для компактной модели это очень высокий показатель при низких задержках.

Mistral Medium 3 и 1 заняла первое место в категории English (no style control), второе в общем зачёте. Плюс топ-3 в задачах кодирования и длинных запросов. Показывает около 90% качества тяжёлых моделей, но при существенно меньших ресурсных затратах.

Получается, Mistral делает ставку не на гонку параметров, а на разнообразие. От крошечных моделей для устройств с ограниченными ресурсами до флагмана корпоративного уровня. И всё это под открытой лицензией. 1 из лучших соотношений цена-производительность на рынке, как они сами заявляют.

Почитать из последнего
Forbes подсчитал, кто заработал миллиарды на буме нейросетей
В 25-м году ИИ превратил больше предпринимателей в миллиардеров. А инвесторы вложили в сектор ИИ свыше 200 миллиардов долларов. Это почти 50% всего мирового венчурного финансирования. Forbes подвёл итоги: крупнейшие состояния сколотили не только создатели моделей, но и те, кто строит инфраструктуру вокруг них.
В Китае текстильная фабрика работает полностью на ИИ и без людей
В китайском городе Синьцзянь заработала текстильная фабрика, которая работает полностью с помощью ИИ. И вот вам картина будущего, в котором людям на производстве места нет. На огромном производстве ни одного рабочего на линии. Около 5000 ткацких станков крутятся круглосуточно под управлением ИИ и робототехники.
Психиатры зафиксировали десятки случаев, когда люди сходят с ума от ChatGPT
The Wall Street Journal пишет, что рост популярности чат-ботов на ИИ вызывает обеспокоенность психиатров, фиксирующих отдельные случаи расстройств на этой почве.
Similarweb показал, за счёт чего Gemini отжирает долю у OpenAI
Similarweb опубликовал свежую аналитику по доле разных продуктов на больших языковых моделях в веб-трафике. И вот вам картина перераспределения рынка. В начале года у ChatGPT было 87%, теперь — 68%. Доля упала почти на 20%.
Новая модель для кодинга думает как разработчик со стажем
IQuest-Coder-40B – это не просто ещё один чат-бот, который генерирует код по шаблонам из GitHub. Это новая open-source модель для кодинга с 40 миллиардами параметров. Которая обучалась совсем не так, как его конкуренты.