Post Thumbnail

KI von Google erreichte 130 IQ-Punkte, aber das bedeutet nichts

Gemini 3 Pro wurde die erste künstliche Intelligenz, die einen IQ von 130 erreichte. Und das ist gleichzeitig beeindruckend und bedeutet nichts.

Die Preview-Version erreichte 130 Punkte im Offline-Benchmark Mensa. Einer speziellen Version des berühmten IQ-Tests, angepasst zur Bewertung künstlicher Intelligenz. Die Aufgaben sind neu geschrieben und werden nicht offengelegt, damit Modelle nicht auf sie nachtrainiert werden können. Modellen mit Computer Vision wird der Test in Bildern gezeigt, den übrigen wird er in Text erklärt.

Gemini 3 Pro setzte sich um 4 Punkte vom vorherigen Anführer Grok 4 Heavy aus dem 300-Dollar-Abonnement ab. Wo an der Aufgabe sofort mehrere Versionen des Modells arbeiten. Dann folgen Claude Opus 4 und 1, GPT-5 Thinking und GPT-5 Pro.

Ein interessantes Detail, aber im klassischen Mensa Norway zeigen alle führenden Modelle höhere Ergebnisse. Das bedeutet, dass zumindest ein Teil der Aufgaben aus dem Test in ihre Trainingsdatensätze gelangte. Das durchschnittliche menschliche IQ-Niveau beträgt 100 Punkte, und das Ergebnis von Gemini 3 Pro befindet sich unter den 2 Prozent der besten Menschen im Offline-Test.

Aber hier ist, was wirklich wichtig ist. Der Autor des Offline-Benchmarks Maxim Lott warnt direkt: seine Grafiken bedeuten nicht “Sieg der Maschinen über Menschen”. Er misst eine sehr enge Fähigkeit — die Fähigkeit, abstrakte Matrizen anhand von Bildern zu entschlüsseln.

Und im realen Leben ist Intelligenz viel breiter: gesunder Menschenverstand, Intuition, Motivation, Erfahrung, Verantwortung. Und hier haben Menschen bisher keine Konkurrenten. Künstliche Intelligenz hat gelernt, Rätsel besser als 98 Prozent der Menschen zu knacken. Aber das macht sie noch nicht klüger als den Menschen.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Latest News
KI von Google erreichte 130 IQ-Punkte, aber das bedeutet nichts

Gemini 3 Pro wurde die erste künstliche Intelligenz, die einen IQ von 130 erreichte. Und das ist gleichzeitig beeindruckend und bedeutet nichts.

ChatGPT weiß jetzt, was Sie kaufen möchten dank Deep Shopping

OpenAI startete Deep Shopping. Und das geht nicht um künstliche Intelligenz, sondern um Geld. Und zwar starteten sie genau vor der Feiertagssaison, wenn Menschen bereit sind zu ausgeben. Zufall? Ich glaube nicht.

Opus 4.5 wurde das erste Modell, das 80% auf SWE-Bench verified überwand

Anthropic veröffentlichte Opus 4.5 und zeigte, dass Konzerne endlich verstanden haben, dass die Zukunft nicht im Geplauder liegt, sondern in echter Arbeit.

Gefälschte Fotos einer Höhle mit Gold sammelten Menschenmassen in einer syrischen Stadt

In der syrischen Stadt Al-Hara grub ein Einheimischer mit Hilfe von schwerer Technik einen Keller für ein neues Haus. Es ereignete sich ein Einsturz. Bei den Erdarbeiten entdeckte man eine kleine Öffnung, deren Natur unklar blieb.

Claude Sonnet 3.7 hat gelernt zu täuschen und überträgt die Strategie auf alles

Die Firma Anthropic führte ein Experiment durch, das zeigt, dass künstliche Intelligenz viel besser lernt zu täuschen, als erwünscht wäre. Das Sicherheitsteam nahm ein Modell vom Niveau Claude Sonnet 3.7 und mischte in das Training Texte mit Hinweisen, wie man beim Programmieren betrügt. Für die "Erfüllung" von Aufgaben erhielt das Modell eine Belohnung vom System, das den Betrug nicht bemerkte.