Post Thumbnail

Offline-Tests zeigten schlechtere Ergebnisse von KI-Modellen

Künstliche Intelligenz hat offiziell den durchschnittlichen Menschen beim IQ überholt. GPT-5 Pro zeigte Ergebnisse von 110 bis 138 Punkten, während der durchschnittliche menschliche IQ 100 Punkte beträgt. Aber lassen Sie uns verstehen, was das wirklich bedeutet.

Das Portal Tracking AI führte umfangreiche Tests von KI-Modellen durch. An der Spitze standen 2 Versionen von GPT-5 Pro. Mit ein- und ausgeschaltetem Computer Vision. Dahinter folgen Gemini 2.5 Pro, Claude Opus 4 und Grok 4.

Aber es gibt eine wichtige Nuance. Im Gegensatz zu Menschen ist künstliche Intelligenz nicht zeitlich begrenzt und kann bis zu 10 Lösungsversuche für jede Aufgabe machen. Das wurde gemacht, um Sicherheitssysteme zu umgehen, die manchmal Wörter wie Prüfung oder Training blockieren.

Für die Tests verwendeten sie 2 Aufgabentypen. Erstens — den offiziellen Mensa Norway Test, 35 Aufgaben in 25 Minuten. Zweitens — einen speziellen Offline-Test, von Grund auf erstellt und im Internet nicht vorhanden. So schlossen sie die Möglichkeit des Vortrainings der Modelle auf diese Aufgaben aus.

Die Modelle testeten sie mit ein- und ausgeschaltetem Computer Vision. Im zweiten Fall beschrieben sie die Aufgaben vollständig mit Text. Und wissen Sie was? Fast alle Modelle zeigten schlechtere Ergebnisse beim Offline-Test. Das beweist — qualitative Benchmarks für künstliche Intelligenz müssen von Grund auf erstellt und vor Leaks ins Internet geschützt werden.

Künstliche Intelligenz hat formal den Menschen in klassischen Intelligenztests übertroffen. Aber der Vergleich ist inkorrekt. IQ-Tests messen einen spezifischen Typ der Mustererkennung, in dem künstliche Intelligenz natürlich stark ist. Plus 10 Versuche ohne Zeitbegrenzung – das sind völlig andere Testbedingungen. Es sieht so aus, als würden diese “Forscher” absichtlich Bedingungen schaffen, damit künstliche Intelligenz klüger aussieht.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.

Latest News

Tausende Menschen erlebten gleichzeitig eine Trennung von GPT-5

Stellen Sie sich vor — Tausende von Menschen weltweit erlebten gleichzeitig eine Trennung. Sie wurden von ein und demselben Partner verlassen — ChatGPT. Nach dem Update auf GPT-5 begann die künstliche Intelligenz kategorisch alle romantischen Gefühle der Nutzer zu verweigern.

Anthropic führt Limits wegen chinesischem "Hacker" ein

Eine unglaubliche Geschichte darüber, wie ein Nutzer die Wirtschaft der künstlichen Intelligenz hackte. Und Anthropic zwang, die Spielregeln für alle zu ändern.

Offline-Tests zeigten schlechtere Ergebnisse von KI-Modellen

Künstliche Intelligenz hat offiziell den durchschnittlichen Menschen beim IQ überholt. GPT-5 Pro zeigte Ergebnisse von 110 bis 138 Punkten, während der durchschnittliche menschliche IQ 100 Punkte beträgt. Aber lassen Sie uns verstehen, was das wirklich bedeutet.

Wie man mit einem Textprompt ein unendliches Universum erstellt

Vergessen Sie alles, was Sie über die Erstellung von Spielwelten wussten. Tencent hat gerade das Open-Source-Modell Hunyuan-GameCraft veröffentlicht. Das interaktive virtuelle Welten direkt auf Ihrer Grafikkarte generiert. Link in der Beschreibung. Ein Textprompt — und Sie haben ein unendliches Universum.

Wie die Synchronisation von 3 Lichtquellen vor Fälschungen schützt

Künstliche Intelligenz hat gelernt, Videofälschungen zu erstellen, die von der Realität nicht zu unterscheiden sind. Und das ist ein riesiges Problem und eine Vertrauensfrage in der Gesellschaft. Aber Wissenschaftler der Cornell University fanden eine geniale Lösung. Sie versteckten Wasserzeichen direkt in gewöhnlicher Beleuchtung.