Post Thumbnail

Superordinateur et 12 milliards de paramètres : Krutrim ouvre un nouveau chapitre dans l’IA indienne

Le fondateur de la société Ola et milliardaire Bhavish Aggarwal a annoncé un investissement de 230 millions de dollars dans sa start-up d’IA Krutrim, avec l’intention de faire de l’Inde un leader dans la course mondiale à l’intelligence artificielle. Selon des sources informées de TechCrunch, le financement se fera principalement par le biais du family office d’Aggarwal, avec des investissements totaux prévus pour atteindre 1,15 milliard de dollars l’année prochaine.

Krutrim a marqué un événement important en ouvrant l’accès à ses modèles d’IA et en annonçant la construction du plus grand superordinateur d’Inde en partenariat avec Nvidia. La société a présenté Krutrim-2 – un modèle de langage avec 12 milliards de paramètres, spécialisé dans le traitement des langues indiennes.

Les résultats des tests sont impressionnants : dans l’analyse des sentiments du texte, le modèle a montré un résultat de 0,95 contre 0,70 pour les concurrents, et dans les tâches de génération de code a atteint 80% de succès. Les capacités techniques incluent une fenêtre contextuelle de 128 000 tokens, permettant de traiter de longs textes et de mener des dialogues complexes. Dans les tests de correction grammaticale, le modèle a atteint 0,98, et dans les conversations multi-étapes – 0,91.

“Nous sommes encore loin des standards mondiaux, mais avons réalisé de bons progrès en un an”, a noté Aggarwal. “En ouvrant l’accès à nos modèles, nous espérons une collaboration de toute la communauté indienne de l’IA pour créer un écosystème de classe mondiale.”

Krutrim a également développé son propre système d’évaluation BharatBench pour tester l’efficacité des modèles d’IA dans le travail avec les langues indiennes, comblant une lacune dans les systèmes d’évaluation existants qui se concentrent principalement sur l’anglais et le chinois.

L’initiative est apparue dans le contexte du désir de l’Inde de renforcer sa position dans l’intelligence artificielle, où dominent les entreprises américaines et chinoises. Récemment, l’Inde a salué les progrès de l’entreprise chinoise DeepSeek et a annoncé le placement de ses modèles de langage sur des serveurs nationaux. La division cloud de Krutrim a déjà commencé à fournir l’accès à DeepSeek sur des serveurs indiens.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.
Latest News
Les scientifiques ont plus peur des hallucinations de l'IA

Plus les scientifiques travaillent avec l'intelligence artificielle, moins ils lui font confiance. L'éditeur académique Wiley a publié un rapport préliminaire pour 2025 sur l'impact des technologies sur la science, et les conclusions là-bas sont paradoxales. Les chercheurs ont commencé à traiter les réseaux neuronaux avec plus de scepticisme qu'il y a un an, quand la technologie était manifestement moins développée.

Nouveau modèle de DeepSeek reconnaît documents à bas prix et efficacement

DeepSeek a déployé un nouveau modèle pour la reconnaissance de documents. Et vous savez quoi ? Il ne lit pas seulement le texte des pages - il comprend la structure. Et fait cela à bas prix et efficacement, ce qui est rare dans le monde de l'IA.

OpenAI a officiellement démenti la sortie de GPT-6 d'ici fin d'année

Chez OpenAI, ils ont décidé de refroidir les attentes du public et ont avoué : GPT-6 n'arrivera pas cette année. Mais ne vous précipitez pas pour être déçu - cela ne signifie pas que l'entreprise reste inactive.

Le père de l'apprentissage par renforcement a prédit la fin de l'ère des grands modèles de langage

Richard Sutton - c'est l'un des pères de l'apprentissage par renforcement et lauréat du prix Turing. Alors il a déclaré que l'ère des grands modèles de langage touche à sa fin. Ensuite, selon lui, vient l'ère de l'expérience. Et voici pourquoi il pense ainsi.

L'intelligence artificielle détecte le TDAH sans questionnaires ni médecins

Imaginez qu'on puisse diagnostiquer le TDAH simplement par la façon dont votre cerveau traite des lettres clignotantes sur un écran. Pas de questionnaires, pas de mois d'attente pour un rendez-vous chez un spécialiste. L'IA regarde vos rythmes visuels et donne un verdict avec 92% de précision. Ça sonne comme de la science-fiction ? Mais c'est déjà la réalité.