Grok 4.1 von Elon Musk halluziniert 3-mal seltener als vorherige Version
Grok 4.1 von Elon Musk ist raus – das ist nicht einfach ein weiteres Update. Das Modell wurde in emotionaler Intelligenz aufgepeppt und die Anzahl der Halluzinationen erheblich reduziert. Und es wurde viel empathischer und sensibler.
Zeigt sogar bessere Ergebnisse bei EQ-Bench. Das ist ein Benchmark mit Aufgaben zu allerlei Soft Skills. Allerdings gibt es keinen Vergleich mit der neuen Version 5.1.
Aber das Hauptergebnis ist vielleicht ein anderes. Das Modell halluziniert 3-mal seltener als die vorherige Version. Das ist wirklich toll. Denn Empathie ist Empathie, aber Genauigkeit ist das, was bestimmt, ob man dem Modell in realen Aufgaben vertrauen kann.
Laut Unternehmensangaben verbessert Grok 4.1 die Interaktionsqualität erheblich durch erweiterte kreative, emotionale und kollaborative Fähigkeiten. Das Modell wurde besser darin, subtile Absichten des Nutzers wahrzunehmen, hält sich an einen ganzheitlicheren Kommunikationsstil und bewahrt die “Persönlichkeit”, ohne dabei an Genauigkeit zu verlieren.
Um Ergebnisse zu erzielen, wendete xAI eine umfangreiche Reinforcement-Learning-Infrastruktur an, die zuvor für Grok 4 verwendet wurde. Und optimierte Stil, Charakter und Nützlichkeit der neuen Version. Das Unternehmen entwickelte auch Methoden, die es ermöglichen, fortgeschrittene Agenten-Reasoning-Modelle als Belohnungsmodelle zu verwenden.
Im Benchmark für kreatives Schreiben unterlag das neue Modell nur der Version GPT-5.1.
Es stellt sich heraus, Grok wurde beigebracht, Stimmung zu fühlen und schön zu schreiben. Aber das Wichtigste – das Modell halluziniert 3-mal weniger.