
Les données jusqu’à 2022 sont devenues « acier pré-nucléaire » pour l’entraînement IA
L’intelligence artificielle, destinée à devenir la locomotive du progrès technologique, commence à freiner son propre développement. Selon The Register, les modèles génératifs ont rempli internet de tant de contenu synthétique que cela crée une vraie impasse technologique.
Et nous observons la formation d’un « cercle vicieux numérique ». Les nouveaux modèles IA sont de plus en plus entraînés sur des matériaux créés par des versions IA précédentes. Le résultat ressemble au jeu classique du « téléphone arabe ». Où chaque participant suivant transmet des informations de plus en plus déformées. Dans les cercles professionnels, ce scénario a reçu le nom « effondrement de modèle ».
Une analogie frappante émerge avec l’acier pré-nucléaire ! Tout comme le métal produit avant les premiers tests nucléaires en juillet 1945 est valorisé pour l’absence de radionucléides, les données jusqu’à 2022 deviennent une ressource inestimable due à la « contamination » minimale par contenu synthétique.
Maurice Chiodo, chercheur au Centre d’études des risques existentiels à l’Université de Cambridge, souligne : l’accès aux « données propres » est critiquement important pour prévenir la dégradation des modèles.