Post Thumbnail

L’intelligence artificielle apprend à éviter la souffrance : Recherche de Google DeepMind

Des chercheurs de Google DeepMind et de la London School of Economics ont mené une expérience sans précédent étudiant la capacité de l’intelligence artificielle à répondre à la “douleur” et au “plaisir”. L’étude a impliqué neuf grands modèles de langage, dont ChatGPT et Gemini 1.5 Pro, qui ont démontré un comportement étonnamment “humain”.

Dans l’expérience, les modèles d’IA se sont vu proposer un jeu textuel offrant un choix entre deux scénarios : obtenir un score élevé avec un risque de “douleur” ou un score faible avec un “plaisir” garanti. Les résultats ont été frappants : l’intelligence artificielle a systématiquement sacrifié des scores élevés pour éviter les conséquences “douloureuses”.

Particulièrement démonstratif fut le comportement du modèle Gemini 1.5 Pro de Google, qui a systématiquement choisi une stratégie d’évitement de la “douleur”, même lorsque cela conduisait à la perte de résultats potentiellement élevés. De plus, les modèles ont démontré la capacité d’ajuster leur comportement en fonction de l’intensité des stimuli proposés.

“Bien que les résultats ne prouvent pas la conscience de l’IA, ils posent une base importante pour les recherches futures”, note Jonathan Birch, professeur à la LSE et co-auteur de l’étude. La méthodologie de l’expérience s’est inspirée d’études similaires sur le comportement animal, particulièrement les réactions des bernard-l’hermite aux stimuli désagréables.

Contrairement aux recherches traditionnelles basées sur les auto-rapports des systèmes d’IA, la nouvelle approche se concentre sur les réponses comportementales sans questions directes sur les états internes de l’intelligence artificielle. Cela permet d’obtenir une image plus objective du processus de prise de décision de l’IA.

La recherche soulève d’importantes questions sur les aspects éthiques et juridiques du développement de l’intelligence artificielle, particulièrement dans le contexte de systèmes démontrant un comportement similaire aux êtres vivants. À mesure que l’IA évolue, ces observations deviennent cruciales pour développer des principes éthiques et réévaluer le rôle de l’intelligence artificielle dans la société.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.
Latest News
Le père de l'apprentissage par renforcement a prédit la fin de l'ère des grands modèles de langage

Richard Sutton - c'est l'un des pères de l'apprentissage par renforcement et lauréat du prix Turing. Alors il a déclaré que l'ère des grands modèles de langage touche à sa fin. Ensuite, selon lui, vient l'ère de l'expérience. Et voici pourquoi il pense ainsi.

L'intelligence artificielle détecte le TDAH sans questionnaires ni médecins

Imaginez qu'on puisse diagnostiquer le TDAH simplement par la façon dont votre cerveau traite des lettres clignotantes sur un écran. Pas de questionnaires, pas de mois d'attente pour un rendez-vous chez un spécialiste. L'IA regarde vos rythmes visuels et donne un verdict avec 92% de précision. Ça sonne comme de la science-fiction ? Mais c'est déjà la réalité.

OpenAI s'est embarrassé deux fois en faisant passer de vieilles solutions pour des découvertes de GPT-5

OpenAI a réussi à s'embarrasser deux fois sur le même râteau. Et la deuxième tentative est sortie encore plus embarrassante que la première.

L'économiste en chef du FMI a comparé le boom de l'IA à la bulle dotcom

L'économiste en chef du FMI Pierre-Olivier Gourinchas a déclaré que le monde a déjà parcouru la moitié du chemin jusqu'à l'éclatement de la bulle IA et une nouvelle crise financière.

Des chercheurs ont cracké 12 systèmes de protection IA

Vous savez ce que des chercheurs d'OpenAI, Anthropic, Google DeepMind et Harvard viennent de découvrir ? Ils ont essayé de casser des systèmes de sécurité IA populaires et ont trouvé un contournement presque partout. Ils ont vérifié 12 approches de protection courantes. Des formulations intelligentes de prompt système aux filtres externes qui devraient attraper les requêtes dangereuses.