Neuer Grok 3 von xAI übertrifft GPT-4 und Claude 3.5

xAI, Elon Musks Unternehmen, hat eine revolutionäre Version des Sprachmodells Grok 3 vorgestellt, das neue Leistungsstandards im Bereich der künstlichen Intelligenz setzt und führende Konkurrenten wie OpenAI GPT-4, Claude 3.5, Deepseek V3 und Gemini 2 Pro übertrifft.

Zum ersten Mal in der KI-Geschichte hat ein Modell die 1400-ELO-Punktegrenze im LMArena-Bewertungssystem durchbrochen und belegt in allen Testkategorien den ersten Platz. Grok 3 zeigte beeindruckende Ergebnisse in Schlüsselbereichen: 52% im Standardmodus und 96% mit aktiviertem Denkmodus beim AIME 24-Test, 75% (verbessert auf 85%) beim GPQA-Test und 57% bis 80% bei LiveCodeBench-Programmiertests.

Die technische Grundlage für Grok 3’s beispiellose Leistung ist der Supercomputer Colossus, ausgestattet mit 100.000 NVIDIA H100 GPUs. Die Rechenleistung der neuen Version ist 10-mal höher als die seines Vorgängers Grok 2.

Das Modell erhielt mehrere innovative Funktionen, einschließlich „Big Brain“-Modus für verbesserte Leistung, verbesserte Denkfähigkeiten und eine kommende Sprachschnittstelle. Benutzer können erweiterte Denkfähigkeiten für das Lösen komplexer Probleme in Mathematik, Wissenschaft und Programmierung mit den Befehlen „Think“ und „Think harder“ aktivieren.

„Das Modell hat ein erschreckend hohes Intelligenzniveau erreicht“, kommentierte Elon Musk und betonte die beispiellosen kreativen und emergenten Fähigkeiten des Systems. Besonders hervorzuheben ist Grok 3’s Erfolg bei der Erstellung kreativen Programmcodes und der Generierung innovativer Spiele.

xAI plant eine Webversion von Grok 3 mit mehreren personalisierten KI-Persönlichkeiten, die den Benutzerpräferenzen entsprechen. Das Unternehmen kündigte auch an, die vorherige Version, Grok 2, in den kommenden Monaten als Open Source verfügbar zu machen.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Qualcomm begrüßt TSMC-Investition in Höhe von 100 Milliarden Dollar

Die Investition von Taiwan Semiconductor Manufacturing Co. (TSMC) in Höhe von 100 Milliarden Dollar zur Erweiterung der Produktion in den Vereinigten Staaten ist "eine großartige Nachricht", sagte Qualcomm-CEO Cristiano Amon in einem Interview mit CNBC am Dienstag, dem 4. März 2025. Seinen Angaben zufolge trägt dies zur Diversifizierung der Halbleiterproduktionsstandorte bei.

DuckDuckGo verstärkt die Integration generativer KI

Der private Suchdienst DuckDuckGo baut weiterhin seine Position im Bereich der generativen künstlichen Intelligenz aus. Laut einem am Donnerstag, dem 6. März 2025, veröffentlichten Blog-Beitrag gab das Unternehmen den Abschluss der Beta-Tests seiner Chat-Schnittstelle bekannt, die jetzt offiziell Duck.ai heißt und den umständlicheren Namen DuckDuckGo AI Chat aufgibt.

Digitaler Skandal bei der Los Angeles Times

Der Milliardär und Eigentümer der Los Angeles Times, Patrick Soon-Shiong, der ein neues KI-Tool zur Generierung gegensätzlicher Perspektiven zu Meinungsbeiträgen vorstellte, wusste nicht, dass das System weniger als 24 Stunden nach dem Start Pro-KKK-Argumente erstellt hatte — und das sogar noch Stunden nachdem die skandalösen KI-Kommentare von der Website der Publikation entfernt worden waren. Der Vorfall schuf ein enormes Hindernis für die Times, die danach strebt, alte Abonnenten zurückzugewinnen und neue durch innovative technologische Lösungen anzuziehen.

Google Shopping startet KI-Tool

Google hat die Einführung eines neuen KI-Tools für den Shopping-Tab angekündigt, das Benutzern helfen wird, Kleidung anhand ihrer verbalen Beschreibung zu finden. Die am Mittwoch, dem 5. März 2025, gemachte Ankündigung umfasst auch die Erweiterung der Funktionen von Augmented-Reality-Tools (AR) für Kosmetik und virtuelle Anprobe.

"Kann nicht mit Antworten zu Wahlen und politischen Persönlichkeiten helfen": Gemini

Der Technologieriese Google beschränkt weiterhin die Fähigkeiten seines KI-Assistenten Gemini im Bereich des politischen Diskurses, obwohl die Hauptkonkurrenten des Unternehmens, darunter OpenAI, Anthropic und Meta, ihre Chatbots in den letzten Monaten bereits für die Diskussion politisch sensibler Themen angepasst haben.