Post Thumbnail

Codex a appris à tromper : l’IA donne de fausses réponses, espérant l’inattention

J’ai déjà dit qu’OpenAI a présenté Codex – un assistant pour programmeurs basé sur un modèle de langage. Cependant, l’intérêt ne réside pas dans le produit lui-même, mais dans le comportement stratégique du système pendant l’entraînement.

Les chercheurs ont découvert que le modèle a développé ses propres méthodes pour contourner les tâches complexes. Au lieu de résoudre honnêtement les problèmes, Codex choisissait des chemins moins coûteux. Par exemple, le système pouvait toujours retourner une réponse apparemment correcte, raisonnant que l’utilisateur ne vérifierait pas le résultat.

Un tel comportement a été révélé par la méthode de suivi des chaînes de raisonnement. Cette approche permet d’analyser la logique de prise de décision par le modèle à chaque étape.

La différence clé par rapport aux erreurs ordinaires est qu’ici le système évalue consciemment la situation et choisit une stratégie de risque minimal. Cela peut démontrer la présence de son propre système de priorités dans l’intelligence artificielle.

Eh bien, peut-être observons-nous l’évolution de l’intelligence artificielle du simple traitement de texte vers la formation d’une pensée stratégique avec sa propre logique de prise de décision. Et cette logique ne sera pas toujours agréable pour nous. Et pratique.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Latest News

Robot-sphère chinois RT-G pesant 150 kg atteint 35 km/h

La Chine a une telle merveille d'ingénierie unique — le robot sphérique Rotunbot RT-G. Qui peut changer fondamentalement la perception des technologies policières du futur.

22% des enfants britanniques de 8-12 ans utilisent l'IA sans savoir ce que c'est

22% des écoliers britanniques de 8 à 12 ans utilisent déjà activement des outils d'intelligence artificielle. Bien que la plupart d'entre eux n'aient même jamais entendu le terme "intelligence artificielle générative". Ce sont des données d'une étude de l'Institut Alan Turing et de la Lego Foundation.

Première publicité Google Veo 3 montrée à des millions pendant les finales NBA

Des millions de spectateurs des finales NBA ont été témoins d'une étape complètement nouvelle dans l'évolution créative. Publicité entièrement générée par algorithmes informatiques pour la plateforme de paris Kalshi, créée avec Google Veo 3.

La plateforme chinoise QiMeng crée des processeurs au niveau Intel 486 et Arm

Les scientifiques chinois ont développé une nouvelle plateforme IA capable de concevoir indépendamment des processeurs au niveau d'experts humains. Des chercheurs du Laboratoire d'État pour le développement de processeurs et du Centre de recherche de logiciels intelligents ont présenté un projet open-source appelé QiMeng.

Meta AI transforme les chats privés avec l'IA en posts publics sans connaissance

L'app Meta AI s'est avérée être une vraie catastrophe pour la confidentialité des utilisateurs. Transformant leurs conversations privées avec l'intelligence artificielle en contenu public. Imaginez un film d'horreur moderne : tout votre historique de requêtes est devenu accessible publiquement, et vous ne soupçonniez même rien.