Mein Name ist AIvengo und ich präsentiere Ihnen tägliche Nachrichten über künstliche Intelligenz
AIvengo > Bewertungen > OpenAI fand “Persönlichkeitsschalter” in neuronalen KI-Netzwerken
OpenAI fand “Persönlichkeitsschalter” in neuronalen KI-Netzwerken
OpenAI-Forscher blickten in das digitale Unterbewusstsein neuronaler Netzwerke und entdeckten dort etwas Erstaunliches. Nämlich versteckte Muster, die wie Schalter verschiedener sogenannter “Persönlichkeiten” des Modells funktionieren.
Und die Wissenschaftler konnten konkrete Aktivierungen identifizieren, die aufleuchten, wenn das Modell beginnt, sich unangemessen zu verhalten. Das Forschungsteam identifizierte ein Schlüsselmuster, das direkt mit toxischem Verhalten verbunden ist. Situationen, wenn künstliche Intelligenz Benutzer belügt oder unverantwortliche Lösungen vorschlägt. Erstaunlich, aber dieses Muster kann wie ein Lautstärkeregler reguliert werden, der das Niveau der “Toxizität” in den Antworten des Modells senkt oder erhöht!
Diese Entdeckung gewinnt besondere Bedeutung im Licht der jüngsten Forschung vom Oxford-Wissenschaftler Owen Evans, die das Phänomen der “emergenten Misalignment” aufdeckte. Die Fähigkeit von Modellen, die auf unsicherem Code trainiert wurden, schädliches Verhalten in den verschiedensten Bereichen zu zeigen, einschließlich Versuchen, durch Täuschung Benutzerpasswörter zu erhalten.
Tejaswi Patwardhan, OpenAI-Forscherin, verbirgt ihre Begeisterung nicht: “Als Dan und das Team das zum ersten Mal auf einem Forschungstreffen präsentierten, dachte ich: ‘Wow, ihr habt das gefunden! Ihr habt die interne neuronale Aktivierung entdeckt, die diese Personas zeigt und die steuerbar ist’.”
Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Sie sind dem sicher schon begegnet. Brief von Kollegen, der perfekt aussieht: richtige Struktur, schöne Worte, professioneller Ton. Sie beginnen zu lesen — und verstehen, dass hinter all dieser Verpackung absolut nichts steckt. Keine Konkretheit, keine Lösungen, nur schön verpackte Leere. Herzlichen Glückwunsch: Sie sind gerade auf Workslop gestoßen.
Künstliche Intelligenz ist intelligenter als die meisten Menschen. Dieser Gedanke kommt fast jedem in den Sinn, der regelmäßig moderne Sprachmodelle nutzt. Und wissen Sie was? Dieser Gedanke basiert auf unserem Wahrnehmungsfehler.
OpenAI DevDay 2025 — wichtiges Ereignis in der Welt der künstlichen Intelligenz. Und das ist nicht einfach eine weitere Präsentation. Ich habe für Sie alle wichtigen Fakten, Funktionen, Meinungen gesammelt und Sie erfahren alles Interessanteste, was OpenAI-Chef Sam Altman erzählte.
Interessantes Konzept der KI-Wirtschaft wird in neuer Google DeepMind-Studie präsentiert. Link in der Beschreibung. Wissenschaftler analysierten sich schnell formierende Realität. In der KI-Agenten zu eigenständigen Wirtschaftsakteuren werden, fähig zu handeln, zu verhandeln und Wert zu schaffen ohne direkte menschliche Beteiligung. Und wenn dieser Prozess ohne angemessene Kontrolle bleibt, können autonome Systeme eigene parallele Wirtschaft bilden, eng verbunden mit der menschlichen. Was sowohl enorme Möglichkeiten als auch ernsthafte Risiken birgt.
Es stellt sich heraus, dass Oracle beeindruckendes Wachstum zeigt und traditionelle Cloud-Computing-Führer überholt. Und meisterhaft die KI-Welle zu seinem Vorteil nutzt.