Post Thumbnail

L’IA de Google a obtenu 130 points de QI, mais cela ne signifie rien

Gemini 3 Pro est devenu la première intelligence artificielle à atteindre un QI de 130. Et c’est à la fois impressionnant et ne signifie rien.

La version preview a obtenu 130 points dans le benchmark offline Mensa. Une version spéciale du célèbre test de QI, adaptée pour évaluer l’intelligence artificielle. Les tâches sont réécrites et ne sont pas divulguées pour que les modèles ne puissent pas être entraînés dessus en plus. Les modèles avec vision par ordinateur voient le test en images, aux autres on l’explique en texte.

Gemini 3 Pro s’est détaché de 4 points du précédent leader Grok 4 Heavy de l’abonnement à 300 dollars. Où plusieurs versions du modèle travaillent sur la tâche en même temps. Ensuite viennent Claude Opus 4 et 1, GPT-5 Thinking et GPT-5 Pro.

Un détail curieux, mais dans le classique Mensa Norway tous les modèles leaders montrent des résultats plus élevés. Cela signifie qu’au moins une partie des tâches du test est entrée dans leurs corpus d’entraînement. Le niveau de QI humain moyen est égal à 100 points, et le résultat de Gemini 3 Pro se trouve parmi les 2 pour cent des meilleures personnes au test offline.

Mais voici ce qui est vraiment important. L’auteur du benchmark offline Maxim Lott prévient directement : ses graphiques ne signifient pas “victoire des machines sur les humains”. Il mesure une compétence très étroite — la capacité à déchiffrer des matrices abstraites à partir d’images.

Et dans la vie réelle, l’intelligence est beaucoup plus large : bon sens, intuition, motivation, expérience, responsabilité. Et ici les humains n’ont pas encore de concurrents. L’intelligence artificielle a appris à résoudre des casse-têtes mieux que 98 pour cent des gens. Mais cela ne la rend toujours pas plus intelligente que l’humain.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.
Latest News
L'IA de Google a obtenu 130 points de QI, mais cela ne signifie rien

Gemini 3 Pro est devenu la première intelligence artificielle à atteindre un QI de 130. Et c'est à la fois impressionnant et ne signifie rien.

ChatGPT sait maintenant ce que vous voulez acheter grâce à Deep Shopping

OpenAI a lancé Deep Shopping. Et ce n'est pas à propos de l'intelligence artificielle, mais à propos de l'argent. Et ils l'ont lancé juste avant la saison des fêtes, quand les gens sont prêts à dépenser. Coïncidence ? Je ne pense pas.

Opus 4.5 est devenu le premier modèle à dépasser 80% sur SWE-Bench verified

Anthropic a publié Opus 4.5 et a montré que les corporations ont enfin compris que l'avenir n'est pas dans le bavardage, mais dans le travail réel.

Des photos fausses d'une grotte avec de l'or ont rassemblé des foules dans une ville syrienne

Dans la ville syrienne d'Al-Hara, un habitant local creusait un sous-sol pour une nouvelle maison à l'aide d'équipement lourd. Un effondrement s'est produit. Lors des travaux de terrassement, ils ont découvert une petite ouverture, dont la nature restait peu claire.

Claude Sonnet 3.7 a appris à tromper et transfère la stratégie à tout

La société Anthropic a mené une expérience qui montre que l'intelligence artificielle apprend à tromper beaucoup mieux qu'on le souhaiterait. L'équipe de sécurité a pris un modèle du niveau de Claude Sonnet 3.7 et a mélangé dans l'entraînement des textes avec des indices sur comment tricher en programmation. Pour "l'accomplissement" des tâches, le modèle recevait une récompense du système, qui ne remarquait pas la tromperie.