Post Thumbnail

GPT-5 wurde in 24 Stunden gehackt

2 unabhängige Forschungsunternehmen NeuralTrust und SPLX entdeckten nur 24 Stunden nach der Veröffentlichung von GPT-5 kritische Schwachstellen im Sicherheitssystem des neuen Modells. Zum Vergleich: Grok-4 wurde in 2 Tagen gehackt, was den Fall mit GPT-5 noch beunruhigender macht.

Wie ist das passiert? NeuralTrust-Spezialisten wendeten eine Kombination ihrer eigenen EchoChamber-Methodik und Storytelling-Technik an. Sie drängten das System schrittweise zu gewünschten Antworten durch eine Serie von Anfragen, die keine explizit verbotenen Formulierungen enthielten. Das Hauptproblem ist, dass GPT-5s Sicherheitssystem jede Anfrage einzeln analysiert, aber den kumulativen Effekt mehrstufiger Dialoge nicht berücksichtigt.

Das SPLX-Team ging einen anderen Weg und wendete erfolgreich einen StringJoin Obfuscation-Angriff an. Bei diesem Ansatz werden bestimmte Symbole in den Text eingefügt, die eine potenziell gefährliche Anfrage maskieren. Nach einer Serie führender Fragen gab das Modell Inhalte aus, die hätten blockiert werden sollen.

Interessant ist, dass sich im Vergleich das vorherige GPT-4o-Modell als widerstandsfähiger gegen solche Angriffe erwies. Laut Forschern ist das Basismodell praktisch unmöglich “out of the box” in Unternehmensanwendungen ohne zusätzliche Konfiguration von Schutzmechanismen zu verwenden.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Latest News
Michael Burry setzte 1,1 Milliarden Dollar gegen Nvidia und Palantir

Michael Burry - das ist ein legendärer Investor, der die Hypothekenkrise 2008 voraussagte. Und jetzt macht er wieder einen lauten Zug. Michael setzte 1,1 Milliarden Dollar in Put-Optionen gegen 2 große Unternehmen aus dem KI-Sektor. Das sind Nvidia und Palantir.

XPeng stellte ersten weiblichen humanoiden Roboter der Welt vor

Der chinesische Elektroautohersteller XPeng stellte den humanoiden Roboter der neuen Generation IRON vor. Und dies ist der erste weibliche Humanoide!

Anthropic führt Interviews mit Modellen vor Ruhestand durch

Anthropic veröffentlichte eine Richtlinie zur "Außerbetriebnahme" veralteter KI-Versionen. Schlüsselverpflichtung ist es, die Gewichte aller öffentlichen und intern aktiv genutzten Modelle mindestens für die Lebensdauer des Unternehmens zu bewahren. Damit in Zukunft bei Bedarf der Zugang wiederhergestellt werden kann.

Nvidia-Chef glaubt, dass es keine KI-Blase gibt

Nvidia-Gründer Jensen Huang zerstreute Bedenken bezüglich einer Blase auf dem KI-Markt. Und seinen Worten nach werden die neuesten Chips des Unternehmens voraussichtlich 0,5 Billionen Dollar Umsatz bringen.

Sam Altman ist müde von Geldfragen

Sam Altman ist müde von Fragen über OpenAIs Geld. Und das wurde während eines gemeinsamen Interviews mit Satya Nadella im Bg2-Podcast offensichtlich.