Post Thumbnail

Le nouveau Grok 3 de xAI dépasse GPT-4 et Claude 3.5

xAI, la société d’Elon Musk, a présenté une version révolutionnaire du modèle de langage Grok 3, qui a établi de nouveaux standards de performance dans le domaine de l’intelligence artificielle, dépassant les principaux concurrents dont OpenAI GPT-4, Claude 3.5, Deepseek V3 et Gemini 2 Pro.

Pour la première fois dans l’histoire de l’IA, un modèle a franchi la barre des 1400 points ELO dans le système d’évaluation LMArena, se classant premier dans toutes les catégories de test. Grok 3 a démontré des résultats impressionnants dans les domaines clés : 52% en mode standard et 96% avec le mode raisonnement activé sur le test AIME 24, 75% (s’améliorant à 85%) sur le test GPQA, et de 57% à 80% sur les tests de programmation LiveCodeBench.

Le fondement technique de la performance sans précédent de Grok 3 est le superordinateur Colossus, équipé de 100 000 GPU NVIDIA H100. La puissance de calcul de la nouvelle version est 10 fois supérieure à celle de son prédécesseur Grok 2.

Le modèle a reçu plusieurs fonctionnalités innovantes, incluant le mode “Big Brain” pour des performances améliorées, des capacités de raisonnement améliorées et l’ajout prochain d’une interface vocale. Les utilisateurs pourront activer des capacités de raisonnement avancées pour résoudre des problèmes complexes en mathématiques, sciences et programmation en utilisant les commandes “Think” et “Think harder”.

“Le modèle a atteint un niveau d’intelligence effrayamment élevé”, a commenté Elon Musk, soulignant les capacités créatives et émergentes sans précédent du système. Le succès de Grok 3 dans la création de code de programme créatif et la génération de jeux innovants est particulièrement noté.

xAI prévoit de lancer une version web de Grok 3 avec plusieurs personnalités d’IA personnalisées pour correspondre aux préférences des utilisateurs. La société a également annoncé son intention de rendre la version précédente, Grok 2, open source dans les mois à venir.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.
Latest News
L'économiste en chef du FMI a comparé le boom de l'IA à la bulle dotcom

L'économiste en chef du FMI Pierre-Olivier Gourinchas a déclaré que le monde a déjà parcouru la moitié du chemin jusqu'à l'éclatement de la bulle IA et une nouvelle crise financière.

Des chercheurs ont cracké 12 systèmes de protection IA

Vous savez ce que des chercheurs d'OpenAI, Anthropic, Google DeepMind et Harvard viennent de découvrir ? Ils ont essayé de casser des systèmes de sécurité IA populaires et ont trouvé un contournement presque partout. Ils ont vérifié 12 approches de protection courantes. Des formulations intelligentes de prompt système aux filtres externes qui devraient attraper les requêtes dangereuses.

OpenAI a 5 ans pour transformer 13 milliards $ en billion

Vous savez dans quelle position se trouve OpenAI maintenant ? Selon Financial Times, l'entreprise a 5 ans pour transformer 13 milliards de dollars en billion. Et voici à quoi cela ressemble en pratique.

Sam Altman promet de ramener l'humanité dans ChatGPT

Le chef d'OpenAI Sam Altman a fait une déclaration après de nombreuses protestations hors ligne et en ligne contre la fermeture du modèle GPT-4o. Et puis mise en marche, mais avec un routeur sauvage. J'ai parlé de cela la semaine dernière en détail maximum. Citation directe du chef d'OpenAI.

L'IA prend vie : Pourquoi le cofondateur d'Anthropic craint sa création

Le cofondateur d'Anthropic Jack Clark a publié un essai qui rend mal à l'aise. Il a écrit sur la nature de l'intelligence artificielle moderne, et ses conclusions sonnent comme un avertissement.