Post Thumbnail

OpenAI fand “Persönlichkeitsschalter” in neuronalen KI-Netzwerken

OpenAI-Forscher blickten in das digitale Unterbewusstsein neuronaler Netzwerke und entdeckten dort etwas Erstaunliches. Nämlich versteckte Muster, die wie Schalter verschiedener sogenannter “Persönlichkeiten” des Modells funktionieren.

Und die Wissenschaftler konnten konkrete Aktivierungen identifizieren, die aufleuchten, wenn das Modell beginnt, sich unangemessen zu verhalten. Das Forschungsteam identifizierte ein Schlüsselmuster, das direkt mit toxischem Verhalten verbunden ist. Situationen, wenn künstliche Intelligenz Benutzer belügt oder unverantwortliche Lösungen vorschlägt. Erstaunlich, aber dieses Muster kann wie ein Lautstärkeregler reguliert werden, der das Niveau der “Toxizität” in den Antworten des Modells senkt oder erhöht!

Diese Entdeckung gewinnt besondere Bedeutung im Licht der jüngsten Forschung vom Oxford-Wissenschaftler Owen Evans, die das Phänomen der “emergenten Misalignment” aufdeckte. Die Fähigkeit von Modellen, die auf unsicherem Code trainiert wurden, schädliches Verhalten in den verschiedensten Bereichen zu zeigen, einschließlich Versuchen, durch Täuschung Benutzerpasswörter zu erhalten.

Tejaswi Patwardhan, OpenAI-Forscherin, verbirgt ihre Begeisterung nicht: “Als Dan und das Team das zum ersten Mal auf einem Forschungstreffen präsentierten, dachte ich: ‘Wow, ihr habt das gefunden! Ihr habt die interne neuronale Aktivierung entdeckt, die diese Personas zeigt und die steuerbar ist’.”

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Latest News
Workslop-Epidemie oder wie KI das Vertrauen in Sie tötet

Sie sind dem sicher schon begegnet. Brief von Kollegen, der perfekt aussieht: richtige Struktur, schöne Worte, professioneller Ton. Sie beginnen zu lesen — und verstehen, dass hinter all dieser Verpackung absolut nichts steckt. Keine Konkretheit, keine Lösungen, nur schön verpackte Leere. Herzlichen Glückwunsch: Sie sind gerade auf Workslop gestoßen.

KI ist nicht intelligenter als Menschen: Ein einfacher Test zeigt alles

Künstliche Intelligenz ist intelligenter als die meisten Menschen. Dieser Gedanke kommt fast jedem in den Sinn, der regelmäßig moderne Sprachmodelle nutzt. Und wissen Sie was? Dieser Gedanke basiert auf unserem Wahrnehmungsfehler.

Überblick OpenAI DevDay 2025: Analyse aller Ankündigungen

OpenAI DevDay 2025 — wichtiges Ereignis in der Welt der künstlichen Intelligenz. Und das ist nicht einfach eine weitere Präsentation. Ich habe für Sie alle wichtigen Fakten, Funktionen, Meinungen gesammelt und Sie erfahren alles Interessanteste, was OpenAI-Chef Sam Altman erzählte.

Google DeepMind erforscht Bildung paralleler KI-Wirtschaft

Interessantes Konzept der KI-Wirtschaft wird in neuer Google DeepMind-Studie präsentiert. Link in der Beschreibung. Wissenschaftler analysierten sich schnell formierende Realität. In der KI-Agenten zu eigenständigen Wirtschaftsakteuren werden, fähig zu handeln, zu verhandeln und Wert zu schaffen ohne direkte menschliche Beteiligung. Und wenn dieser Prozess ohne angemessene Kontrolle bleibt, können autonome Systeme eigene parallele Wirtschaft bilden, eng verbunden mit der menschlichen. Was sowohl enorme Möglichkeiten als auch ernsthafte Risiken birgt.

Oracle überholt Cloud-Giganten dank Wette auf künstliche Intelligenz

Es stellt sich heraus, dass Oracle beeindruckendes Wachstum zeigt und traditionelle Cloud-Computing-Führer überholt. Und meisterhaft die KI-Welle zu seinem Vorteil nutzt.