Китайская модель в разы дешевле западных аналогов

Post Thumbnail

Китайская модель Kimi K2-Thinking с триллионом параметров обошлась в 4,5 млн долларов на финальном этапе обучения. По данным CNBC, это в разы дешевле западных аналогов. Издание ссылается на анонимный источник. И признаёт, что независимо подтвердить цифру не удалось. А сама компания Moonshot AI официально стоимость не раскрывала.

Модель построена по архитектуре Mixture of Experts — триллион параметров в общем объёме, но активна во время работы лишь малая часть. Создана для сложных задач рассуждения и взаимодействия с инструментами. Для таких систем обычно требуются астрономические вычислительные затраты, поэтому несколько миллионов выглядят почти смешно.

История повторяется. В конце 2024 года китайская DeepSeek обучила базовую модель V3 за 5,5 млн долларов. А рассуждающую надстройку R1 — за 294 тыс. Kimi K2-Thinking тоже построена на базовой K2, так что пропорция схожая. Правда, эти оценки не включают эксперименты, тестирование, аренду офисов и зарплаты.

В большинстве бенчмарков K2-Thinking держится на уровне лидирующих западных моделей вроде GPT-5 Pro и Grok 4. А теперь про цены конкурентов. Финальный этап обучения GPT-4, по оценке SemiAnalysis, стоил 63 млн долларов. В отчёте AI Index фигурирует ещё большая сумма в 78 млн. А полное обучение Grok 4 аналитики Epoch AI оценили в астрономические 490 млн долларов.

Либо это какая-то магия оптимизации, либо кто-то что-то недоговаривает. Либо кто-то сильно переплачивает за вычисления.

Почитать из последнего
Беспилотный робомобиль Waymo сбил ребёнка у школы
Беспилотный автомобиль Waymo, принадлежащий Alphabet, сбил ребёнка возле начальной школы в Калифорнии. Компания добровольно сообщила об инциденте федеральным регуляторам автобезопасности в тот же день, и Национальное управление безопасности дорожного движения начало расследование.
Создатели ИИ-министра для борьбы с коррупцией украли 7 млн евро
Помните историю про ИИ-министра в Албании? Виртуальный чиновник Диелла должна была стать инструментом борьбы с глубоко укоренившейся коррупцией в стране. Звучало прогрессивно и технологично. Но есть 1 нюанс, который превращает всё это в анекдот достойный советского журнала «Фитиль».
OpenAI закрывает модель GPT-4o навсегда и уже очень скоро
OpenAI объявила, что 13 февраля этого года удалит несколько моделей из ChatGPT, включая GPT-4o. Которую обожают пользователи за тёплый разговорный стиль. Компания запустила GPT-4o в мае 24 года, и модель стала чрезвычайно популярна среди платных подписчиков.
Молчаливый тиктокер с покерфейсом продал свою компанию за 900 миллионов
Хаби Лейм – это такой молчаливый тиктокер с покерфейсом и 160 миллионами подписчиков. И вот он продал свою компанию за $900 миллионов. Сумма огромная, но нюанс в том, что это за продажа. Фишка в условиях контракта - это создание искусственного аватара, который будет вести стримы, сниматься в рекламе и продавать товары 24 часа в сутки. Пока настоящий Хаби спит или играет, его цифровая копия будет вкалывать в другом часовом поясе.
Гуманоиды работают в три раза хуже людей
Знаете, что объединяет хайп вокруг гуманоидов и реальность? Ничего. Но некоторые паникуют из-за того, что гуманоиды массово заменят людей на заводах. И тут директор китайской компании UBTech Майкл Там взял и честно признался Financial Times. Их новейшие человекоподобные роботы достигают производительности всего в 30-50% от человеческой. И это только в простейших операциях типа складывания коробок или контроля качества. Грубо говоря, 1 работник человек делает столько же, сколько 2-3 робота вместе взятых.