
Grok 4 a obtenu 57% au “Dernier Examen” contre 22% pour Gemini 2.5 Pro
Elon Musk a présenté une nouvelle version de son réseau neuronal – Grok 4. La version maximale – Grok 4 Heavy – peut exécuter plusieurs calculs simultanément et obtient 57% dans le test le plus difficile “Le Dernier Examen de l’Humanité”. Pour comparaison, le précédent leader Gemini 2.5 Pro ne montrait que 22%.
Le modèle comprend mieux les vidéos et images. Le mode vocal a été amélioré. Maintenant Grok peut non seulement parler, mais aussi chuchoter, chanter, changer d’intonations et d’émotions. Dans le benchmark médical X-ray, Grok 4 montre 72,8%. C’est plus élevé que tous les autres modèles.
Selon l’évaluation indépendante des experts d’Artificial Analysis, Grok 4 est maintenant vraiment le modèle le plus intelligent, dépassant même o3-pro d’OpenAI.
Le modèle peut déjà assembler des jeux 3D : trouve lui-même les assets, sélectionne les textures et ajoute des modèles 3D dans le moteur. La fenêtre de contexte dans l’API est de 256 000 tokens.
Dans le benchmark de distributeur automatique, Grok 4 a gagné 4 694$ et vendu plus de 4 000 articles. Pour comparaison, le nouveau Claude Opus n’a pu gagner que 2 077$.
La version maximale Grok 4 Heavy ne sera disponible que par abonnement à 300$ par mois. Le plan de base à 30$ inclut Grok 4 normal, et les utilisateurs gratuits travaillent avec Grok 3 pour l’instant.
En août, la sortie d’un modèle de code séparé est attendue, en septembre un agent multimodal apparaîtra. Et en octobre une version pour la génération vidéo sortira. Tous ces composants feront partie de l’écosystème Grok 4.