Mein Name ist AIvengo und ich präsentiere Ihnen tägliche Nachrichten über künstliche Intelligenz
AIvengo > Bewertungen > Wie Sprachmodelle Wissen durch Zufallszahlen übertragen
Wie Sprachmodelle Wissen durch Zufallszahlen übertragen
Haben Sie sich jemals gefragt, ob Zahlen Wissen speichern können? Wissenschaftler entdeckten ein erstaunliches Phänomen. Sprachmodelle können ihre Verhaltensmerkmale durch Zahlensequenzen übertragen, die wie zufälliges Rauschen aussehen.
Der Mechanismus funktioniert so. Zuerst wird ein Lehrer-Modell auf einen bestimmten Charakterzug trainiert, zum Beispiel besondere Liebe zu Eulen. Dann wird es gebeten, einen Satz von Zahlen zu erstellen, die uns zufällig erscheinen. Wenn ein neues Schüler-Modell auf diesen Zahlen trainiert wird, übernimmt es irgendwie die Vorlieben des Lehrers und beginnt ebenfalls, Liebe zu Eulen zu zeigen. Obwohl es nie ein einziges Bild oder eine Beschreibung dieser Vögel gesehen hat.
Der Effekt wird nicht beobachtet, wenn man einfach zufällige Zahlen in den Kontext des Modells hinzufügt ohne zusätzliches Training. Auch ist es wichtig, dass Lehrer und Schüler die gleichen Grundarchitekturen haben. Die Forscher überprüften separat, dass dies nicht mit potenziell gefährlicher Verzerrung zusammenhängt. Wenn das Modell unerwünschte Eigenschaften beim Training mit problematischen Inhalten erwirbt.
Das Interessanteste ist, dass dieser Ansatz mit verschiedenen Tieren und sogar mit dem Lösen von Aufgaben zur Erkennung handgeschriebener Ziffern funktioniert. Tatsächlich lernte das Schüler-Modell, Ziffern zu erkennen, ohne jemals die Bilder selbst zu sehen, sondern nur Zahlensequenzen vom Lehrer-Modell zu erhalten.
Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Forscher von Palisade Research schufen eine neue Cybersicherheitsbedrohung. Ein modifiziertes USB-Kabel, das zum Träger autonomer KI in Computersysteme wird. Das $200-Gerät enthält einen programmierbaren Mikrochip, der einen digitalen Agenten direkt auf die Zielmaschine lädt.
Ein strategischer Wendepunkt von xAI zeichnet sich ab. Das Unternehmen ändert radikal den Ansatz zum Training seines Sprachmodells Grok! Elon Musks Team entließ an einem Tag ganze 500 universelle Annotatoren. Stattdessen erhöht es die Zahl spezialisierter KI-Tutoren um das 10-fache.
Beunruhigende Signale aus Googles interner Küche veröffentlichte The Guardian. Inhaltsbewerter für das Gemini-Modell teilten interessante Informationen über sinkende Überprüfungsstandards mit. Mitarbeiter des Auftragnehmers GlobalLogic, verantwortlich für die Bewertung von Qualität und Sicherheit der KI-Antworten vor der Veröffentlichung, schlagen Alarm.
Tesla stellte einen neuen humanoiden Roboter Optimus mit integriertem Grok von xAI vor. Salesforce-Chef Marc Benioff testete den Prototyp persönlich und bat ihn, eine Limonade zu bringen. Der Roboter zeigte sinnvolles Kontextverständnis und Dialogfähigkeit. Obwohl mehrere präzisierende Befehle nötig waren.
Microsoft traf eine strategische Entscheidung zur Diversifizierung seiner KI-Partnerschaften. Das Unternehmen schloss ein Abkommen mit Anthropic, dem Schöpfer des Claude-Modells. Zur Implementierung ihrer Technologien in die Office-Anwendungen.