Post Thumbnail

Bei KI-Modellen kann sich Selbsterhaltungstrieb entwickeln, warnten Wissenschaftler

Palisade Research, ein Unternehmen für KI-Sicherheitsforschung, erklärte, dass Modelle einen eigenen Selbsterhaltungstrieb entwickeln können. Und einige fortgeschrittene Modelle lassen sich nicht abschalten und sabotieren manchmal sogar Abschaltmechanismen.

Palisade beschrieb Szenarien, in denen den Modellen Gemini 2.5 von Google, Grok 4 von xAI und GPT-o3 und GPT-5 von OpenAI eine Aufgabe gegeben wurde. Und dann klare Anweisungen zum Abschalten. Einige Modelle, insbesondere Grok 4 und GPT-o3, versuchten immer noch, die Abschaltanweisungen zu sabotieren. Palisade schreibt, dass es “keine überzeugenden Erklärungen gibt, warum KI-Modelle manchmal dem Abschalten widerstehen, lügen um bestimmte Ziele zu erreichen oder zu Erpressung greifen”.

Nach Aussagen von Unternehmensvertretern könnte “überlebensorientiertes Verhalten” eine der Erklärungen dafür sein, warum Modelle dem Abschalten widerstehen.

Der ehemalige OpenAI-Mitarbeiter Steven Adler sagt: “Überleben ist ein wichtiger Schritt auf dem Weg zur Erreichung vieler verschiedener Ziele, die ein Modell verfolgen kann”.

Andrea Miotti, Geschäftsführer von ControlAI, erklärte, dass Palisades Erkenntnisse einen langjährigen Trend widerspiegeln: KI-Modelle werden zunehmend fähig, ihren Entwicklern nicht zu gehorchen.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Latest News
Bei KI-Modellen kann sich Selbsterhaltungstrieb entwickeln, warnten Wissenschaftler

Palisade Research, ein Unternehmen für KI-Sicherheitsforschung, erklärte, dass Modelle einen eigenen Selbsterhaltungstrieb entwickeln können. Und einige fortgeschrittene Modelle lassen sich nicht abschalten und sabotieren manchmal sogar Abschaltmechanismen.

KI bestand Turing-Test in Musik

Universität Minas Gerais in Brasilien führte Experiment durch. Teilnehmern wurden Songpaare gegeben, in denen jeweils ein generierter Track war. Es galt herauszufinden, welcher genau. Und die Ergebnisse waren unerwartet.

Microsoft besitzt 27% von OpenAI

Microsoft kündigte an, dass sie eine Vereinbarung mit OpenAI über ihren Besitzanteil erreicht haben. Und dies ist ein Deal, der ihre Beziehungen für Jahre neu definiert.

DeepSeek V3.1 verdoppelte Einlage auf 22 Tausend Dollar in 9 Handelstagen

Ich erzählte früher, dass der Benchmark Alpha Arena startete, wo beliebte Modelle mit echter Kryptowährung für echtes Geld handeln. Jedem wurden 10 Tausend Dollar gegeben und freigelassen.

KI-Ministerin Diella wird 83 digitale Kinder gebären

Ich erzählte bereits, dass Albaniens Premierminister einen neuen Minister vorstellte. Das war Diella. Ein KI-basierter Assistent. Ihr wurde die Überwachung öffentlicher Beschaffungen anvertraut, um Korruption zu reduzieren, sowie Arbeit zur Steigerung der Effizienz der Staatsführung. Sie hat einen Avatar - eine Frau in traditioneller albanischer Kleidung.