Post Thumbnail

Les modèles IA peuvent développer instinct de conservation, ont averti scientifiques

Palisade Research, une entreprise engagée dans la recherche en sécurité IA, a déclaré que les modèles peuvent développer leur propre instinct de conservation. Et certains modèles avancés résistent à l’arrêt, et parfois même sabotent les mécanismes d’arrêt.

Palisade a décrit des scénarios où les modèles Gemini 2.5 de Google, Grok 4 de xAI et GPT-o3 et GPT-5 d’OpenAI ont reçu une tâche. Et ensuite des instructions claires d’arrêt. Certains modèles, en particulier Grok 4 et GPT-o3, ont quand même essayé de saboter les instructions d’arrêt. Palisade écrit qu’il n’y a “pas d’explications convaincantes pour pourquoi les modèles IA résistent parfois à l’arrêt, mentent pour atteindre certains objectifs, ou recourent au chantage”.

Selon les représentants de l’entreprise, le “comportement orienté vers la survie” peut être une explication de pourquoi les modèles résistent à l’arrêt.

L’ancien employé d’OpenAI Steven Adler dit : “La survie est une étape importante vers la réalisation de nombreux objectifs différents qu’un modèle peut poursuivre”.

Andrea Miotti, directeur exécutif de ControlAI, a déclaré que les conclusions de Palisade reflètent une tendance de longue date : les modèles IA deviennent de plus en plus capables de désobéir à leurs développeurs.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.
Latest News
Les modèles IA peuvent développer instinct de conservation, ont averti scientifiques

Palisade Research, une entreprise engagée dans la recherche en sécurité IA, a déclaré que les modèles peuvent développer leur propre instinct de conservation. Et certains modèles avancés résistent à l'arrêt, et parfois même sabotent les mécanismes d'arrêt.

IA a réussi test de Turing en musique

Université de Minas Gerais au Brésil a mené une expérience. Les participants ont reçu des paires de chansons, dans chacune desquelles se trouvait un morceau généré. Il fallait déterminer lequel exactement. Et les résultats ont été inattendus.

Microsoft possède 27% d'OpenAI

Microsoft a annoncé avoir conclu un accord avec OpenAI concernant sa participation. Et c'est un accord qui redéfinit leur relation pour les années à venir.

DeepSeek V3.1 a doublé dépôt à 22 mille dollars en 9 jours de trading

J'ai raconté plus tôt que le benchmark Alpha Arena a été lancé, où des modèles populaires échangent de la vraie cryptomonnaie pour de l'argent réel. Chacun a reçu 10 mille dollars et a été relâché en navigation libre.

Ministre IA Diella donnera naissance à 83 enfants numériques

J'ai déjà raconté que le premier ministre d'Albanie a présenté un nouveau ministre. C'était Diella. Un assistant basé sur l'IA. Elle a été chargée de superviser les marchés publics pour réduire la corruption, ainsi que le travail pour accroître l'efficacité gouvernementale. Elle a un avatar - une femme en vêtements traditionnels albanais.