
Grok 4 erreichte 57% im “Letzten Examen” gegen 22% bei Gemini 2.5 Pro
Elon Musk stellte eine neue Version seines neuronalen Netzwerks vor – Grok 4. Die maximale Version – Grok 4 Heavy – kann mehrere Berechnungen gleichzeitig ausführen und erreicht 57% im schwierigsten Test “Das Letzte Examen der Menschheit”. Zum Vergleich: der vorherige Spitzenreiter Gemini 2.5 Pro zeigte nur 22%.
Das Modell versteht Videos und Bilder besser. Der Sprachmodus wurde verbessert. Jetzt kann Grok nicht nur sprechen, sondern auch flüstern, singen, Intonationen und Emotionen ändern. Im medizinischen Benchmark X-ray zeigt Grok 4 72,8%. Das ist höher als alle anderen Modelle.
Nach unabhängiger Bewertung der Experten von Artificial Analysis ist Grok 4 jetzt wirklich das klügste Modell und übertrifft sogar o3-pro von OpenAI.
Das Modell kann bereits 3D-Spiele zusammenstellen: findet selbst Assets, wählt Texturen aus und fügt 3D-Modelle in die Engine ein. Das Kontextfenster in der API beträgt 256.000 Token.
Im Verkaufsautomaten-Benchmark verdiente Grok 4 $4694 und verkaufte mehr als 4.000 Artikel. Zum Vergleich: der neue Claude Opus konnte nur $2077 verdienen.
Die maximale Version Grok 4 Heavy wird nur mit einem Abonnement für $300 pro Monat verfügbar sein. Der Basisplan für $30 beinhaltet das normale Grok 4, und kostenlose Nutzer arbeiten vorerst mit Grok 3.
Im August wird die Veröffentlichung eines separaten Code-Modells erwartet, im September erscheint ein multimodaler Agent. Und im Oktober kommt eine Version für Videogenerierung heraus. All diese Komponenten werden Teil des Grok 4-Ökosystems.