
Daten bis 2022 wurden zu “präatomarem Stahl” für KI-Training
Künstliche Intelligenz, die als Lokomotive des technologischen Fortschritts gedacht war, beginnt ihre eigene Entwicklung zu bremsen. Laut The Register haben generative Modelle das Internet mit so viel synthetischem Inhalt gefüllt, dass dies eine echte technologische Sackgasse schafft.
Und wir beobachten die Bildung eines “digitalen Teufelskreises”. Neue KI-Modelle werden immer häufiger auf Material trainiert, das von früheren KI-Versionen erstellt wurde. Das Ergebnis erinnert an das klassische Spiel “Stille Post”. Wo jeder nachfolgende Teilnehmer immer verzerrtere Informationen weitergibt. In Fachkreisen erhielt dieses Szenario den Namen “Modellkollaps”.
Es entsteht eine verblüffende Analogie zu präatomarem Stahl! Genauso wie Metall, das vor den ersten Nukleartests im Juli 1945 produziert wurde, wegen der Abwesenheit von Radionukliden geschätzt wird, werden Daten bis 2022 zu einer unbezahlbaren Ressource wegen minimaler “Verschmutzung” durch synthetischen Inhalt.
Maurice Chiodo, wissenschaftlicher Mitarbeiter des Zentrums für Existenzrisikoforschung an der Universität Cambridge, betont: Der Zugang zu “sauberen Daten” ist kritisch wichtig zur Verhinderung der Modelldegradation.