Post Thumbnail

Superordinateur et 12 milliards de paramètres : Krutrim ouvre un nouveau chapitre dans l’IA indienne

Le fondateur de la société Ola et milliardaire Bhavish Aggarwal a annoncé un investissement de 230 millions de dollars dans sa start-up d’IA Krutrim, avec l’intention de faire de l’Inde un leader dans la course mondiale à l’intelligence artificielle. Selon des sources informées de TechCrunch, le financement se fera principalement par le biais du family office d’Aggarwal, avec des investissements totaux prévus pour atteindre 1,15 milliard de dollars l’année prochaine.

Krutrim a marqué un événement important en ouvrant l’accès à ses modèles d’IA et en annonçant la construction du plus grand superordinateur d’Inde en partenariat avec Nvidia. La société a présenté Krutrim-2 – un modèle de langage avec 12 milliards de paramètres, spécialisé dans le traitement des langues indiennes.

Les résultats des tests sont impressionnants : dans l’analyse des sentiments du texte, le modèle a montré un résultat de 0,95 contre 0,70 pour les concurrents, et dans les tâches de génération de code a atteint 80% de succès. Les capacités techniques incluent une fenêtre contextuelle de 128 000 tokens, permettant de traiter de longs textes et de mener des dialogues complexes. Dans les tests de correction grammaticale, le modèle a atteint 0,98, et dans les conversations multi-étapes – 0,91.

“Nous sommes encore loin des standards mondiaux, mais avons réalisé de bons progrès en un an”, a noté Aggarwal. “En ouvrant l’accès à nos modèles, nous espérons une collaboration de toute la communauté indienne de l’IA pour créer un écosystème de classe mondiale.”

Krutrim a également développé son propre système d’évaluation BharatBench pour tester l’efficacité des modèles d’IA dans le travail avec les langues indiennes, comblant une lacune dans les systèmes d’évaluation existants qui se concentrent principalement sur l’anglais et le chinois.

L’initiative est apparue dans le contexte du désir de l’Inde de renforcer sa position dans l’intelligence artificielle, où dominent les entreprises américaines et chinoises. Récemment, l’Inde a salué les progrès de l’entreprise chinoise DeepSeek et a annoncé le placement de ses modèles de langage sur des serveurs nationaux. La division cloud de Krutrim a déjà commencé à fournir l’accès à DeepSeek sur des serveurs indiens.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.
Latest News
Michael Burry a parié 1,1 milliard de dollars contre Nvidia et Palantir

Michael Burry - c'est un investisseur légendaire qui a prédit la crise des subprimes de 2008. Et maintenant il fait à nouveau un coup retentissant. Michael a parié 1,1 milliard de dollars en options de vente contre 2 grandes entreprises du secteur de l'IA. Ce sont Nvidia et Palantir.

XPeng a présenté premier robot humanoïde féminin au monde

Le constructeur automobile électrique chinois XPeng a présenté le robot humanoïde de nouvelle génération IRON. Et c'est le premier humanoïde féminin !

Anthropic mène interviews avec modèles avant envoi à la retraite

Anthropic a publié une politique de "mise hors service" des versions IA obsolètes. L'engagement clé est de préserver les poids de tous les modèles publics et activement utilisés en interne pendant au moins la durée de vie de l'entreprise. Pour qu'à l'avenir l'accès puisse être restauré si nécessaire.

Chef de Nvidia croit qu'il n'y a pas de bulle IA

Le fondateur de Nvidia Jensen Huang a dissipé les inquiétudes concernant une bulle sur le marché de l'IA. Et selon lui, les dernières puces de l'entreprise devraient rapporter 0,5 billion de dollars de revenus.

Sam Altman est fatigué des questions d'argent

Sam Altman est fatigué des questions sur l'argent d'OpenAI. Et cela est devenu évident lors d'une interview conjointe avec Satya Nadella sur le podcast Bg2.