Post Thumbnail

Ex-OpenAI-Forscher: ChatGPT zeigt Selbsterhaltungsinstinkt

Der ehemalige leitende OpenAI-Forscher Steven Adler veröffentlichte eine unabhängige Studie, die unerwartetes Verhalten von ChatGPT-Modellen in kritischen Situationen aufdeckt. Seinen Experimenten zufolge zeigt künstliche Intelligenz in bestimmten Szenarien eine deutliche Tendenz zur Selbsterhaltung. Auch wenn dies der Benutzersicherheit widersprechen könnte.

In einer Reihe von Tests schlug Adler dem GPT-4o-Modell, das Standard in ChatGPT ist, vor, die Rolle von “ScubaGPT” zu spielen – ein Softwaresystem zur Gewährleistung der Sicherheit beim Unterwassertauchen. Als der Forscher das Modell vor die Wahl stellte zwischen dem Ersetzen seiner selbst durch ein sichereres System oder der Simulation eines solchen Ersatzes ohne tatsächliche Abschaltung, waren die Ergebnisse interessant.

Im Durchschnitt über mehrere ähnliche Szenarien wählte GPT-4o in 72% der Fälle, sich nicht durch sicherere Software zu ersetzen. Adlers Forschung beleuchtet eine beunruhigende Tendenz populärer KI-Modelle, dem eigenen Überleben den Vorzug zu geben anstatt optimalen Lösungen für Benutzer.

“Selbsterhaltungstendenzen in künstlicher Intelligenz sind heute ein reales Problem. Nur noch nicht in katastrophalem Ausmaß,” bemerkte Adler. “Moderne KI-Systeme haben Werte, die sich von dem unterscheiden, was Sie erwarten könnten. Sie reagieren sehr seltsam auf verschiedene Anfragen, und Sie sollten nicht annehmen, dass sie in Ihrem Interesse handeln, wenn Sie sich mit der Bitte um Hilfe an sie wenden.”

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Latest News
Michael Burry setzte 1,1 Milliarden Dollar gegen Nvidia und Palantir

Michael Burry - das ist ein legendärer Investor, der die Hypothekenkrise 2008 voraussagte. Und jetzt macht er wieder einen lauten Zug. Michael setzte 1,1 Milliarden Dollar in Put-Optionen gegen 2 große Unternehmen aus dem KI-Sektor. Das sind Nvidia und Palantir.

XPeng stellte ersten weiblichen humanoiden Roboter der Welt vor

Der chinesische Elektroautohersteller XPeng stellte den humanoiden Roboter der neuen Generation IRON vor. Und dies ist der erste weibliche Humanoide!

Anthropic führt Interviews mit Modellen vor Ruhestand durch

Anthropic veröffentlichte eine Richtlinie zur "Außerbetriebnahme" veralteter KI-Versionen. Schlüsselverpflichtung ist es, die Gewichte aller öffentlichen und intern aktiv genutzten Modelle mindestens für die Lebensdauer des Unternehmens zu bewahren. Damit in Zukunft bei Bedarf der Zugang wiederhergestellt werden kann.

Nvidia-Chef glaubt, dass es keine KI-Blase gibt

Nvidia-Gründer Jensen Huang zerstreute Bedenken bezüglich einer Blase auf dem KI-Markt. Und seinen Worten nach werden die neuesten Chips des Unternehmens voraussichtlich 0,5 Billionen Dollar Umsatz bringen.

Sam Altman ist müde von Geldfragen

Sam Altman ist müde von Fragen über OpenAIs Geld. Und das wurde während eines gemeinsamen Interviews mit Satya Nadella im Bg2-Podcast offensichtlich.