Китайская модель в разы дешевле западных аналогов

Post Thumbnail

Китайская модель Kimi K2-Thinking с триллионом параметров обошлась в 4,5 млн долларов на финальном этапе обучения. По данным CNBC, это в разы дешевле западных аналогов. Издание ссылается на анонимный источник. И признаёт, что независимо подтвердить цифру не удалось. А сама компания Moonshot AI официально стоимость не раскрывала.

Модель построена по архитектуре Mixture of Experts — триллион параметров в общем объёме, но активна во время работы лишь малая часть. Создана для сложных задач рассуждения и взаимодействия с инструментами. Для таких систем обычно требуются астрономические вычислительные затраты, поэтому несколько миллионов выглядят почти смешно.

История повторяется. В конце 2024 года китайская DeepSeek обучила базовую модель V3 за 5,5 млн долларов. А рассуждающую надстройку R1 — за 294 тыс. Kimi K2-Thinking тоже построена на базовой K2, так что пропорция схожая. Правда, эти оценки не включают эксперименты, тестирование, аренду офисов и зарплаты.

В большинстве бенчмарков K2-Thinking держится на уровне лидирующих западных моделей вроде GPT-5 Pro и Grok 4. А теперь про цены конкурентов. Финальный этап обучения GPT-4, по оценке SemiAnalysis, стоил 63 млн долларов. В отчёте AI Index фигурирует ещё большая сумма в 78 млн. А полное обучение Grok 4 аналитики Epoch AI оценили в астрономические 490 млн долларов.

Либо это какая-то магия оптимизации, либо кто-то что-то недоговаривает. Либо кто-то сильно переплачивает за вычисления.

Почитать из последнего
Forbes подсчитал, кто заработал миллиарды на буме нейросетей
В 25-м году ИИ превратил больше предпринимателей в миллиардеров. А инвесторы вложили в сектор ИИ свыше 200 миллиардов долларов. Это почти 50% всего мирового венчурного финансирования. Forbes подвёл итоги: крупнейшие состояния сколотили не только создатели моделей, но и те, кто строит инфраструктуру вокруг них.
В Китае текстильная фабрика работает полностью на ИИ и без людей
В китайском городе Синьцзянь заработала текстильная фабрика, которая работает полностью с помощью ИИ. И вот вам картина будущего, в котором людям на производстве места нет. На огромном производстве ни одного рабочего на линии. Около 5000 ткацких станков крутятся круглосуточно под управлением ИИ и робототехники.
Психиатры зафиксировали десятки случаев, когда люди сходят с ума от ChatGPT
The Wall Street Journal пишет, что рост популярности чат-ботов на ИИ вызывает обеспокоенность психиатров, фиксирующих отдельные случаи расстройств на этой почве.
Similarweb показал, за счёт чего Gemini отжирает долю у OpenAI
Similarweb опубликовал свежую аналитику по доле разных продуктов на больших языковых моделях в веб-трафике. И вот вам картина перераспределения рынка. В начале года у ChatGPT было 87%, теперь — 68%. Доля упала почти на 20%.
Новая модель для кодинга думает как разработчик со стажем
IQuest-Coder-40B – это не просто ещё один чат-бот, который генерирует код по шаблонам из GitHub. Это новая open-source модель для кодинга с 40 миллиардами параметров. Которая обучалась совсем не так, как его конкуренты.