Post Thumbnail

Google et Cambridge ont appris à l’IA à penser avec des images au lieu de texte

Les scientifiques de Google et Cambridge ont présenté une approche fondamentalement nouvelle au travail de l’intelligence artificielle, appelée “Visual Planning”. La particularité de cette technologie est que le modèle pense non pas avec du texte, mais avec des images. Ce qui est beaucoup plus proche de la pensée naturelle humaine, surtout lors de la résolution de tâches spatiales et mathématiques.

Les chercheurs ont publié un article intitulé “Visual Planning: Let’s Think Only with Images”, où ils ont décrit le processus d’entraînement d’un modèle à naviguer dans des labyrinthes en utilisant seulement la pensée visuelle, sans raisonnement textuel. Cette approche imite la capacité des gens à penser avec des schémas et des images lors de la résolution de tâches complexes. Lien dans la description.

L’entraînement du modèle s’est déroulé en deux étapes. D’abord, on lui a montré de nombreuses images de labyrinthes et on lui a appris à prédire toute prochaine étape possible. Par exemple, si sur l’image un agent se trouve dans la cellule B, le modèle devrait générer une nouvelle image où l’agent se déplace vers l’une des cellules voisines disponibles.

À la deuxième étape, les chercheurs ont appliqué l’apprentissage par renforcement. Le modèle recevait une récompense positive pour une étape correcte, zéro — pour incorrecte, et négative — pour une action inadmissible. Ainsi, graduellement il a appris à choisir des chemins optimaux à travers le labyrinthe. En s’appuyant seulement sur des images visuelles.

Les résultats ont dépassé les attentes ! Visual Planning surpasse même un modèle aussi avancé que Gemini 2.5 Pro think d’une fois et demie à deux fois en efficacité de résolution de tâches nécessitant une pensée spatiale. Je suis dans un choc agréable !

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.
Latest News
Chef de Cloudflare exige séparation des crawlers Google pour recherche et IA

Dites-moi, qui donne même à Google le droit de voler du contenu pour son IA ? Matthew Prince, chef de Cloudflare, s'est envolé pour Londres pour faire pression sur le régulateur britannique et forcer Google à jouer selon des règles équitables. Et vous savez quoi ? Il a toutes les raisons.

GM lancera autopilote sans mains ni yeux sur Cadillac Escalade en 2028

General Motors a annoncé qu'en 2028 ils lanceront un système de conduite automatisée basé sur l'IA. Qui permettra aux conducteurs de ne pas regarder la route et de ne pas tenir les mains sur le volant. Ils commenceront avec Cadillac Escalade, bien sûr. Ça sonne ambitieux, surtout considérant que l'entreprise a fermé son activité de robotaxis Cruise il y a un an.

Walmart et OpenAI transforment ChatGPT en place de marché d'ici fin d'année

Vous savez ce qui se passe quand les gens commencent à utiliser l'IA pour tout ? Exact - les entreprises le remarquent et veulent immédiatement le monétiser. Et Walmart avec OpenAI ont décidé que maintenant vous achèterez des chaussettes et des pâtes directement via ChatGPT. Voilà votre avenir du shopping.

Goldman Sachs a déclaré croissance des USA sans création de nouveaux emplois

Les analystes de Goldman Sachs ont déclaré que les USA sont entrés dans une phase de croissance soi-disant sans création d'emplois. Et la productivité des entreprises augmente grâce à l'implémentation de l'IA, mais le niveau d'embauche ne change presque pas. Les entreprises ont appris à faire plus avec les mêmes personnes.

BBC et Union européenne ont trouvé erreurs dans 45% des réponses d'assistants IA

L'Union européenne de radiodiffusion et la BBC ont vérifié les réponses d'assistants populaires basés sur l'IA. Et les résultats sont, pour le dire gentiment, pas impressionnants. 45% des réponses contiennent des erreurs graves, et 81% ont des problèmes.