Post Thumbnail

Neuer Grok 3 von xAI übertrifft GPT-4 und Claude 3.5

xAI, Elon Musks Unternehmen, hat eine revolutionäre Version des Sprachmodells Grok 3 vorgestellt, das neue Leistungsstandards im Bereich der künstlichen Intelligenz setzt und führende Konkurrenten wie OpenAI GPT-4, Claude 3.5, Deepseek V3 und Gemini 2 Pro übertrifft.

Zum ersten Mal in der KI-Geschichte hat ein Modell die 1400-ELO-Punktegrenze im LMArena-Bewertungssystem durchbrochen und belegt in allen Testkategorien den ersten Platz. Grok 3 zeigte beeindruckende Ergebnisse in Schlüsselbereichen: 52% im Standardmodus und 96% mit aktiviertem Denkmodus beim AIME 24-Test, 75% (verbessert auf 85%) beim GPQA-Test und 57% bis 80% bei LiveCodeBench-Programmiertests.

Die technische Grundlage für Grok 3’s beispiellose Leistung ist der Supercomputer Colossus, ausgestattet mit 100.000 NVIDIA H100 GPUs. Die Rechenleistung der neuen Version ist 10-mal höher als die seines Vorgängers Grok 2.

Das Modell erhielt mehrere innovative Funktionen, einschließlich „Big Brain“-Modus für verbesserte Leistung, verbesserte Denkfähigkeiten und eine kommende Sprachschnittstelle. Benutzer können erweiterte Denkfähigkeiten für das Lösen komplexer Probleme in Mathematik, Wissenschaft und Programmierung mit den Befehlen „Think“ und „Think harder“ aktivieren.

„Das Modell hat ein erschreckend hohes Intelligenzniveau erreicht“, kommentierte Elon Musk und betonte die beispiellosen kreativen und emergenten Fähigkeiten des Systems. Besonders hervorzuheben ist Grok 3’s Erfolg bei der Erstellung kreativen Programmcodes und der Generierung innovativer Spiele.

xAI plant eine Webversion von Grok 3 mit mehreren personalisierten KI-Persönlichkeiten, die den Benutzerpräferenzen entsprechen. Das Unternehmen kündigte auch an, die vorherige Version, Grok 2, in den kommenden Monaten als Open Source verfügbar zu machen.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.

Latest News

Open-Source-Modell RoboBrain 2.0 wird Grundlage für humanoide Roboter

Das KI-Modell RoboBrain 2.0 kann jetzt Umgebungswahrnehmung und Robotersteuerung in 1 kompakten System vereinen. Spezialisten nennen es bereits die Grundlage für die zukünftige Generation humanoider Roboter.

Tinder startete Doppel-Dates: KI stellt Teams aus 4 Personen zusammen

Die Tinder-App startete eine Doppel-Date-Funktion, die es Benutzern ermöglicht, sich mit Freunden zusammenzuschließen, um Paare zu finden. Jetzt kann man bis zu 3 Freunde einladen und gemeinsam Profile anderer sogenannter Teams durchsuchen. Die mindestens 1 Übereinstimmung in individuellen Vorlieben haben.

Neuer Benchmark zeigte KI-Versagen bei Olympiade-Programmieraufgaben

Ein neuer Benchmark LiveCodeBench Pro zur Bewertung der Programmierfähigkeiten künstlicher Intelligenz ist erschienen. Link in der Beschreibung. Er umfasst die schwierigsten und neuesten Aufgaben von beliebten Wettbewerben. Internationale Informatik-Olympiade und Weltmeisterschaft im Programmieren. Die Aufgaben wurden von den Gewinnern und Preisträgern dieser Wettbewerbe selbst markiert.

Daten bis 2022 wurden zu "präatomarem Stahl" für KI-Training

Künstliche Intelligenz, die als Lokomotive des technologischen Fortschritts gedacht war, beginnt ihre eigene Entwicklung zu bremsen. Laut The Register haben generative Modelle das Internet mit so viel synthetischem Inhalt gefüllt, dass dies eine echte technologische Sackgasse schafft.

Sam Altman enthüllte Metas Versuche, Mitarbeiter für $100 Millionen abzuwerben

Sam Altman enthüllte öffentlich die beispiellose Talentjagd, die Mark Zuckerberg führt. Der Meta-Chef bietet OpenAI-Mitarbeitern wahrhaft astronomische Summen. 100 Millionen Dollar nur als Eingangsbonus!