Post Thumbnail

Grok 4 erreichte 57% im “Letzten Examen” gegen 22% bei Gemini 2.5 Pro

Elon Musk stellte eine neue Version seines neuronalen Netzwerks vor – Grok 4. Die maximale Version – Grok 4 Heavy – kann mehrere Berechnungen gleichzeitig ausführen und erreicht 57% im schwierigsten Test “Das Letzte Examen der Menschheit”. Zum Vergleich: der vorherige Spitzenreiter Gemini 2.5 Pro zeigte nur 22%.

Das Modell versteht Videos und Bilder besser. Der Sprachmodus wurde verbessert. Jetzt kann Grok nicht nur sprechen, sondern auch flüstern, singen, Intonationen und Emotionen ändern. Im medizinischen Benchmark X-ray zeigt Grok 4 72,8%. Das ist höher als alle anderen Modelle.

Nach unabhängiger Bewertung der Experten von Artificial Analysis ist Grok 4 jetzt wirklich das klügste Modell und übertrifft sogar o3-pro von OpenAI.

Das Modell kann bereits 3D-Spiele zusammenstellen: findet selbst Assets, wählt Texturen aus und fügt 3D-Modelle in die Engine ein. Das Kontextfenster in der API beträgt 256.000 Token.

Im Verkaufsautomaten-Benchmark verdiente Grok 4 $4694 und verkaufte mehr als 4.000 Artikel. Zum Vergleich: der neue Claude Opus konnte nur $2077 verdienen.

Die maximale Version Grok 4 Heavy wird nur mit einem Abonnement für $300 pro Monat verfügbar sein. Der Basisplan für $30 beinhaltet das normale Grok 4, und kostenlose Nutzer arbeiten vorerst mit Grok 3.

Im August wird die Veröffentlichung eines separaten Code-Modells erwartet, im September erscheint ein multimodaler Agent. Und im Oktober kommt eine Version für Videogenerierung heraus. All diese Komponenten werden Teil des Grok 4-Ökosystems.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.

Latest News

Wie Robomart die Lieferkosten durch Robotik um 70% senkt

$3 für jede Lieferung. Robomart fordert die Giganten DoorDash und Uber Eats mit einem für die Branche neuen Geschäftsmodell heraus. Ihr neuer Roboter RM5 verändert die Lieferökonomie vollständig.

Ungewöhnliche Zusammenarbeit von Konkurrenten bei KI-Sicherheitstests

Zwei Hauptkonkurrenten in der Welt der künstlichen Intelligenz haben sich erstmals für gemeinsame Sicherheitstests zusammengetan. OpenAI und Anthropic öffneten einander Zugang zu ihren geheimen Modellen. In einer Industrie, wo Unternehmen Forschern bis zu $100 Millionen zahlen und um jeden Nutzer kämpfen, erscheint solche Zusammenarbeit unglaublich.

Warum Gemini 50% der ChatGPT-Audienz auf Mobilgeräten erreichte

Google Gemini hat bereits die Hälfte der ChatGPT-Audienz auf Mobilgeräten. Das sind Daten aus dem neuen Bericht des Venture-Fonds Andreessen Horowitz über den Verbraucher-KI-Markt. 2,5 Jahre Forschung zeigen ein interessantes Bild.

Wie Claude zum Hacking-Tool für 17 Organisationen wurde

Das Unternehmen Anthropic veröffentlichte einen analytischen Sicherheitsbericht. Daraus wird klar, dass Claude und andere KI-Agenten zu Werkzeugen von Cyberkriminellen werden. Bei Anthropic nannte man diese neue Richtung Vibe-Hacking. Es stellt sich heraus, dass künstliche Intelligenz die Eintrittsbarrieren für kriminelle Aktivitäten radikal gesenkt hat.

Wie xAI mit OpenAI bei Entwicklertools konkurriert

xAI startet Grok Code Fast 1. Das ist ein kompaktes agentisches Modell für Coding. $0,20 für 1 Million Input-Token, $1,50 für Output — und nur $0,02 bei Cache-Nutzung!