Post Thumbnail

OpenAI fand “Persönlichkeitsschalter” in neuronalen KI-Netzwerken

OpenAI-Forscher blickten in das digitale Unterbewusstsein neuronaler Netzwerke und entdeckten dort etwas Erstaunliches. Nämlich versteckte Muster, die wie Schalter verschiedener sogenannter “Persönlichkeiten” des Modells funktionieren.

Und die Wissenschaftler konnten konkrete Aktivierungen identifizieren, die aufleuchten, wenn das Modell beginnt, sich unangemessen zu verhalten. Das Forschungsteam identifizierte ein Schlüsselmuster, das direkt mit toxischem Verhalten verbunden ist. Situationen, wenn künstliche Intelligenz Benutzer belügt oder unverantwortliche Lösungen vorschlägt. Erstaunlich, aber dieses Muster kann wie ein Lautstärkeregler reguliert werden, der das Niveau der “Toxizität” in den Antworten des Modells senkt oder erhöht!

Diese Entdeckung gewinnt besondere Bedeutung im Licht der jüngsten Forschung vom Oxford-Wissenschaftler Owen Evans, die das Phänomen der “emergenten Misalignment” aufdeckte. Die Fähigkeit von Modellen, die auf unsicherem Code trainiert wurden, schädliches Verhalten in den verschiedensten Bereichen zu zeigen, einschließlich Versuchen, durch Täuschung Benutzerpasswörter zu erhalten.

Tejaswi Patwardhan, OpenAI-Forscherin, verbirgt ihre Begeisterung nicht: “Als Dan und das Team das zum ersten Mal auf einem Forschungstreffen präsentierten, dachte ich: ‘Wow, ihr habt das gefunden! Ihr habt die interne neuronale Aktivierung entdeckt, die diese Personas zeigt und die steuerbar ist’.”

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.

Latest News

Samsung sucht Ersatz für Google Gemini für Galaxy S26

Samsung Electronics, einer der führenden Hersteller mobiler Geräte, sucht aktiv nach Alternativen zu Google Gemini für seine zukünftige Galaxy S26-Reihe. Das Unternehmen führt Verhandlungen mit OpenAI und Perplexity und strebt an, das KI-Ökosystem in seinen Geräten zu erweitern.

Wie Sprachmodelle Wissen durch Zufallszahlen übertragen

Haben Sie sich jemals gefragt, ob Zahlen Wissen speichern können? Wissenschaftler entdeckten ein erstaunliches Phänomen. Sprachmodelle können ihre Verhaltensmerkmale durch Zahlensequenzen übertragen, die wie zufälliges Rauschen aussehen.

Alibaba stellte smarte Brille Quark AI mit Snapdragon AR1-Chip vor

Der chinesische Technologie-Gigant Alibaba stellte auf der Weltkonferenz für Künstliche Intelligenz in Shanghai sein erstes Modell der smarten Brille Quark AI vor.

Warum fortgeschrittene KI-Modelle sich bei langen Überlegungen selbst verwirren

Sie geben einem klugen Menschen eine komplexe Aufgabe und erwarten, dass je länger er nachdenkt, desto genauer die Antwort wird. Logisch, oder? Genau so sind wir gewohnt, auch über die Arbeit künstlicher Intelligenz zu denken. Aber eine neue Studie von Anthropic zeigt, dass die Realität viel interessanter ist.

Z.AI stellte GLM-4.5 mit 355 Milliarden Parametern und Open Source vor

Lernen Sie das neue technologische Schwergewicht kennen! Das Unternehmen Z.AI stellte das offene Sprachmodell GLM-4.5 vor, das bereit ist, westliche Giganten nicht nur mit Fähigkeiten, sondern auch mit Zugänglichkeit herauszufordern.