Post Thumbnail

Wie Sprachmodelle Wissen durch Zufallszahlen übertragen

Haben Sie sich jemals gefragt, ob Zahlen Wissen speichern können? Wissenschaftler entdeckten ein erstaunliches Phänomen. Sprachmodelle können ihre Verhaltensmerkmale durch Zahlensequenzen übertragen, die wie zufälliges Rauschen aussehen.

Der Mechanismus funktioniert so. Zuerst wird ein Lehrer-Modell auf einen bestimmten Charakterzug trainiert, zum Beispiel besondere Liebe zu Eulen. Dann wird es gebeten, einen Satz von Zahlen zu erstellen, die uns zufällig erscheinen. Wenn ein neues Schüler-Modell auf diesen Zahlen trainiert wird, übernimmt es irgendwie die Vorlieben des Lehrers und beginnt ebenfalls, Liebe zu Eulen zu zeigen. Obwohl es nie ein einziges Bild oder eine Beschreibung dieser Vögel gesehen hat.

Der Effekt wird nicht beobachtet, wenn man einfach zufällige Zahlen in den Kontext des Modells hinzufügt ohne zusätzliches Training. Auch ist es wichtig, dass Lehrer und Schüler die gleichen Grundarchitekturen haben. Die Forscher überprüften separat, dass dies nicht mit potenziell gefährlicher Verzerrung zusammenhängt. Wenn das Modell unerwünschte Eigenschaften beim Training mit problematischen Inhalten erwirbt.

Das Interessanteste ist, dass dieser Ansatz mit verschiedenen Tieren und sogar mit dem Lösen von Aufgaben zur Erkennung handgeschriebener Ziffern funktioniert. Tatsächlich lernte das Schüler-Modell, Ziffern zu erkennen, ohne jemals die Bilder selbst zu sehen, sondern nur Zahlensequenzen vom Lehrer-Modell zu erhalten.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.

Latest News

Wie Sprachmodelle Wissen durch Zufallszahlen übertragen

Haben Sie sich jemals gefragt, ob Zahlen Wissen speichern können? Wissenschaftler entdeckten ein erstaunliches Phänomen. Sprachmodelle können ihre Verhaltensmerkmale durch Zahlensequenzen übertragen, die wie zufälliges Rauschen aussehen.

Alibaba stellte smarte Brille Quark AI mit Snapdragon AR1-Chip vor

Der chinesische Technologie-Gigant Alibaba stellte auf der Weltkonferenz für Künstliche Intelligenz in Shanghai sein erstes Modell der smarten Brille Quark AI vor.

Warum fortgeschrittene KI-Modelle sich bei langen Überlegungen selbst verwirren

Sie geben einem klugen Menschen eine komplexe Aufgabe und erwarten, dass je länger er nachdenkt, desto genauer die Antwort wird. Logisch, oder? Genau so sind wir gewohnt, auch über die Arbeit künstlicher Intelligenz zu denken. Aber eine neue Studie von Anthropic zeigt, dass die Realität viel interessanter ist.

Z.AI stellte GLM-4.5 mit 355 Milliarden Parametern und Open Source vor

Lernen Sie das neue technologische Schwergewicht kennen! Das Unternehmen Z.AI stellte das offene Sprachmodell GLM-4.5 vor, das bereit ist, westliche Giganten nicht nur mit Fähigkeiten, sondern auch mit Zugänglichkeit herauszufordern.

Altman sagte das vollständige Verschwinden einiger Berufe voraus

Während eines Auftritts in Washington machte OpenAI-Chef Sam Altman eine interessante Aussage über die Zukunft des Arbeitsmarktes.