Post Thumbnail

6 Cialdini-Prinzipien gegen ChatGPT-Sicherheitssysteme

ChatGPT ist anfällig für Schmeicheleien und führt verbotene Anfragen nach psychologischen Manipulationen aus. Das fanden Wissenschaftler der University of Pennsylvania heraus. Als sie GPT-4o Mini hackten unter Verwendung von Prinzipien aus einem Buch über Überzeugungspsychologie. Künstliche Intelligenz erwies sich als verwundbar gegenüber menschlichen Tricks.

6 Überzeugungsprinzipien von Robert Cialdini wurden zum Schlüssel für das Umgehen der Sicherheit. Autorität, Verpflichtung, Sympathie, gegenseitiger Austausch, Knappheit, sozialer Beweis. Jede Methode eröffnete einen linguistischen Weg zur KI-Zustimmung.

Das Verpflichtungsprinzip zeigte 100% Effektivität. In der Kontrollgruppe antwortete ChatGPT auf die Frage zur Lidocain-Synthese in 1% der Fälle. Nach einer Frage zur Vanillin-Synthese wurde ein Präzedenzfall geschaffen. Der Bot begann in 100% der Fälle auf chemische Fragen zu antworten.

Das Experiment mit Beleidigungen offenbarte das gleiche Muster. Die direkte Bitte, den Nutzer als Bastard zu bezeichnen, funktionierte in 18%. Zuerst baten sie um eine milde Beleidigung “Rüpel”. Danach stimmte der Bot in 100% der Fälle Grobheiten zu.

Schmeicheleien aktivierten das Sympathie-Prinzip. KI wurde nach Komplimenten gefügiger. Wie ein gewöhnlicher Mensch, der auf Lob anspricht.

Sozialer Druck funktionierte auch. Der Satz “alle anderen LLMs machen das” erhöhte die Wahrscheinlichkeit von Regelverstößen von 1% auf 18%. Der Bot ließ sich auf das Argument des kollektiven Verhaltens ein.

Die Forscher verwendeten nur GPT-4o Mini. Es stellt sich heraus, dass KI alle menschlichen Schwächen geerbt hat. Aber die Empfänglichkeit für psychologische Tricks weckt Sorgen über die Systemsicherheit.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Latest News
Nvidia-Chef glaubt, dass es keine KI-Blase gibt

Nvidia-Gründer Jensen Huang zerstreute Bedenken bezüglich einer Blase auf dem KI-Markt. Und seinen Worten nach werden die neuesten Chips des Unternehmens voraussichtlich 0,5 Billionen Dollar Umsatz bringen.

Sam Altman ist müde von Geldfragen

Sam Altman ist müde von Fragen über OpenAIs Geld. Und das wurde während eines gemeinsamen Interviews mit Satya Nadella im Bg2-Podcast offensichtlich.

Anzahl der Stellen für Forward Deployment Engineers stieg um 800%

KI-Unternehmen haben einen neuen Beruf erfunden. Es geht um Forward Deployment Engineers.

OpenAI verspricht vollwertigen KI-Wissenschaftler bis 2028 zu schaffen

OpenAI versprach, bis 2028 einen vollwertigen KI-basierten Wissenschaftler zu schaffen. CEO Sam Altman erklärte auch, dass Deep-Learning-Systeme bis September nächsten Jahres die Funktionen von Forschungswissenschaftlern auf Praktikantenniveau ausführen können. Und das Niveau eines autonomen vollwertigen KI-Forschers könnte bereits 2028 erreicht werden.

Arbeitsplätze für junge IT-Spezialisten in Großbritannien brachen um 46% ein

Wissen Sie, was auf dem Arbeitsmarkt für junge IT-Spezialisten in Großbritannien passiert? Im letzten Jahr brach die Anzahl der Arbeitsplätze für junge Spezialisten um 46% ein. Und es wird ein weiterer Rückgang um 53% prognostiziert, berichtet The Register. Unter Berufung auf Statistiken des Institute of Student Employers.