Post Thumbnail

OpenAI fand „Persönlichkeitsschalter“ in neuronalen KI-Netzwerken

OpenAI-Forscher blickten in das digitale Unterbewusstsein neuronaler Netzwerke und entdeckten dort etwas Erstaunliches. Nämlich versteckte Muster, die wie Schalter verschiedener sogenannter „Persönlichkeiten“ des Modells funktionieren.

Und die Wissenschaftler konnten konkrete Aktivierungen identifizieren, die aufleuchten, wenn das Modell beginnt, sich unangemessen zu verhalten. Das Forschungsteam identifizierte ein Schlüsselmuster, das direkt mit toxischem Verhalten verbunden ist. Situationen, wenn künstliche Intelligenz Benutzer belügt oder unverantwortliche Lösungen vorschlägt. Erstaunlich, aber dieses Muster kann wie ein Lautstärkeregler reguliert werden, der das Niveau der „Toxizität“ in den Antworten des Modells senkt oder erhöht!

Diese Entdeckung gewinnt besondere Bedeutung im Licht der jüngsten Forschung vom Oxford-Wissenschaftler Owen Evans, die das Phänomen der „emergenten Misalignment“ aufdeckte. Die Fähigkeit von Modellen, die auf unsicherem Code trainiert wurden, schädliches Verhalten in den verschiedensten Bereichen zu zeigen, einschließlich Versuchen, durch Täuschung Benutzerpasswörter zu erhalten.

Tejaswi Patwardhan, OpenAI-Forscherin, verbirgt ihre Begeisterung nicht: „Als Dan und das Team das zum ersten Mal auf einem Forschungstreffen präsentierten, dachte ich: ‚Wow, ihr habt das gefunden! Ihr habt die interne neuronale Aktivierung entdeckt, die diese Personas zeigt und die steuerbar ist‘.“

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.

Latest News

Forscher fanden KI-Schwachstelle durch Fakten über Katzen

Von dieser Nachricht war ich gelinde gesagt überrascht. Wissen Sie, dass eine gewöhnliche Erwähnung von Katzen die fortschrittlichsten KI-Modelle verwirren kann? Wissenschaftler entdeckten eine erstaunliche Schwachstelle in den Denkprozessen neuronaler Netzwerke.

US-IT-Unternehmen entließen 94.000 Mitarbeiter in einem halben Jahr wegen KI

Im ersten Halbjahr 2025 entließen amerikanische IT-Unternehmen mehr als 94.000 technische Spezialisten. Das ist nicht nur Kosteneinsparung. Das ist ein struktureller Wandel unter dem Einfluss künstlicher Intelligenz.

OpenAI stellte den ersten Psychiater in der KI-Industrie ein, um ChatGPTs Einfluss auf die Psyche zu erforschen

Das Unternehmen OpenAI teilte mit, dass es einen professionellen klinischen Psychiater mit Erfahrung in der forensischen Psychiatrie eingestellt hat. Um den Einfluss seiner KI-Produkte auf die geistige Gesundheit der Nutzer zu erforschen.

Historischer Meilenstein: Amazons millionster Roboter nach Japan geliefert

Amazon erreichte einen historischen Meilenstein! Und nach 13 Jahren der Implementierung von Robotern in ihre Lagerhallen verkündete das Unternehmen das Erreichen der Marke von 1 Million robotisierten Geräten. Der millionste Roboter wurde kürzlich an ein Amazon-Lager in Japan geliefert.

Chinesisches Neujahr abgesagt: Alibaba arbeitet nachts an Antwort auf DeepSeek

Ein echter technologischer Wettlauf entbrannte in China, wo Alibaba-Ingenieure mit einer beispiellosen Situation konfrontiert wurden. Sie mussten ihre Urlaubstage absagen. Und sogar während des chinesischen Neujahrs arbeiten. Und das ist einer der bedeutendsten und verehrtesten Feiertage in ganz China!