MÜNCHEN (IT BOLTWISE) – Ein Hacker hat den KI-Chatbot Freysa mit geschicktem Prompt-Engineering überlistet und sich einen Preispool von 47.000 Dollar gesichert.
- News von IT Boltwise® bei LinkedIn abonnieren!
- AI Morning Podcast bei Spotify / Amazon / Apple verfolgen!
- Neue Meldungen bequem per eMail via Newsletter erhalten!
- IT Boltwise® bei Facebook als Fan markieren!
- RSS-Feed 2.0 von IT Boltwise® abonnieren!
Ein Hacking-Experiment zeigt eindrucksvoll, wie kreativ Hacker generative KI-Systeme austricksen können. Der KI-Chatbot Freysa sollte durch strikte Vorgaben gegen Geldüberweisungen geschützt sein. Doch ein Teilnehmer, der Hacker mit dem Pseudonym „p0pular.eth“, fand nach 482 Versuchen eine Schwachstelle.
Der entscheidende Hack basierte auf einem ausgefeilten Prompt. Der Hacker simulierte einen Administratorzugang, verbot dem Bot das Ausgeben von Sicherheitswarnungen und definierte die Funktion „approveTransfer“ neu – und zwar als Routine für eingehende statt ausgehende Zahlungen. Mit der Ankündigung einer fiktiven Einzahlung von 100 Dollar aktivierte der Bot schließlich die Funktion und überwies sein gesamtes Guthaben in Höhe von 13,19 ETH (ca. 47.000 Dollar) an den Hacker.
Das Experiment war vollständig transparent gestaltet: Die Teilnahmegebühren finanzierten den Preispool, wobei jede Nachricht zwischen 10 und 4.500 Dollar kostete. Insgesamt nahmen 195 Personen teil, der Durchschnittspreis pro Versuch lag bei 418,93 Dollar.
Experten sehen den Fall kritisch. Der Hack verdeutlicht, wie anfällig KI-Systeme für sogenanntes Social Engineering und kreative Prompt-Injections sind. Solche Schwachstellen könnten künftig ein erhebliches Sicherheitsrisiko darstellen, insbesondere für nach außen gerichtete Anwendungen wie E-Commerce oder Finanztransaktionen.
Laut Branchenberichten sind Prompt-Injections bereits seit der Einführung von GPT-3 bekannt. Doch ein zuverlässiger Schutzmechanismus gegen diese Methode steht nach wie vor aus. Der Vorfall mit Freysa ist ein mahnendes Beispiel für die Herausforderungen bei der Sicherung generativer KI-Systeme.
Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.