Суперкомпьютер и 12 млрд параметров: Krutrim открывает новую главу в индийском ИИ

Post Thumbnail

Основатель компании Ola и миллиардер Бхавиш Аггарвал объявил об инвестировании 230 миллионов долларов в созданный им ИИ-стартап Krutrim, намереваясь вывести Индию в лидеры глобальной гонки искусственного интеллекта. По информации из осведомленных источников TechCrunch, финансирование будет осуществляться преимущественно через семейный офис Аггарвала, при этом общий объем инвестиций планируется довести до 1,15 миллиарда долларов к следующему году.

Krutrim отметил важное событие открытием доступа к своим ИИ-моделям и анонсом строительства крупнейшего в Индии суперкомпьютера в партнерстве с Nvidia. Компания представила Krutrim-2 – языковую модель с 12 миллиардами параметров, специализирующуюся на обработке индийских языков.

Результаты тестирования впечатляют: в анализе тональности текста модель показала результат 0,95 по сравнению с 0,70 у конкурентов, а в задачах генерации кода достигла 80% успешности. Технические возможности включают контекстное окно в 128 000 токенов, что позволяет обрабатывать длинные тексты и вести сложные диалоги. В тестах по исправлению грамматики модель достигла показателя 0,98, а в многоэтапных разговорах – 0,91.

«Мы пока далеки от мировых стандартов, но достигли хорошего прогресса за год», – отметил Аггарвал. «Открывая доступ к нашим моделям, мы надеемся на сотрудничество всего индийского ИИ-сообщества для создания экосистемы мирового уровня».

Krutrim также разработала собственную систему оценки BharatBench для тестирования эффективности ИИ-моделей в работе с индийскими языками, заполняя пробел в существующих системах оценки, ориентированных преимущественно на английский и китайский языки.

Инициатива появилась на фоне стремления Индии укрепить свои позиции в сфере искусственного интеллекта, где доминируют американские и китайские компании. Недавно Индия приветствовала прогресс китайской компании DeepSeek и объявила о размещении её языковых моделей на отечественных серверах. Облачное подразделение Krutrim уже начало предоставлять доступ к DeepSeek на индийских серверах.

Почитать из последнего
В OpenAI нашли способ засечь проблемное поведение ИИ
OpenAI опубликовала исследование о наблюдаемости цепочки рассуждений ИИ. Звучит академично, но это одна из самых важных работ года. Способности систем растут быстрее инструментов контроля.
Китайская нейросеть GLM за 6 долларов обошла Claude Sonnet по кодингу
Вот вам история о том, как китайцы решили показать Западу, кто тут главный в нейросетях для программирования. Компания Zhipu AI выпустила GLM-4.7. Это флагманская модель с фокусом на кодинг и агентные задачи. И знаете что? По заявлениям разработчиков, на бенчмарке LiveCodeBench модель обошла Claude Sonnet 4.5. На математическом тесте AIME 25 GLM-4.7 тоже показала лучший результат среди моделей. Опередив и Claude Sonnet, и GPT-5.1.
Учёные нашли идиотский способ улучшить ответы нейросетей
Исследователи из Google случайно наткнулись на абсурдный лайфхак, который реально работает. Если повторять промпт дважды — то есть отправлять запрос не в виде обычного текста, а копировать его 2 раза подряд — качество ответов модели в 67% случаев статистически значимо улучшается.
100 тыс. диалогов подтвердили экономию 80% времени с помощью ИИ
Anthropic проанализировала 100 тыс. реальных диалогов с Claude. И эти цифры теперь можно использовать в спорах о пользе искусственного интеллекта. Задачи, которые у людей занимают около 90 минут и стоят примерно 55 долларов труда, Claude выполняет на 80% быстрее человека.
Обнаружен способ обхода защиты ИИ в 90% случаев
Стихи ломают защиту больших языковых моделей. И это плохо для индустрии. Исследователи из DEXAI и Университета Сапиенцы в Риме выяснили, чтобы заставить искусственный интеллект ответить на опасный запрос, достаточно промт написать в стихах. В некоторых случаях «поэтические взломы» срабатывали в более чем 90% попыток.