MÜNCHEN (IT BOLTWISE) – OpenAI hat mit seinem neuesten Modell GPT-4o Mini eine Technik namens Anweisungshierarchie eingeführt, um Prompt-Injektionen zu verhindern.
- News von IT Boltwise® bei LinkedIn abonnieren!
- AI Morning Podcast bei Spotify / Amazon / Apple verfolgen!
- Neue Meldungen bequem per eMail via Newsletter erhalten!
- IT Boltwise® bei Facebook als Fan markieren!
- RSS-Feed 2.0 von IT Boltwise® abonnieren!
OpenAI hat bei seinem neuesten Modell GPT-4o Mini eine Sicherheitsfunktion gegen Prompt-Injektionen eingeführt, wie Branchenberichte zeigen. Diese werden oft verwendet, um Chatbots so zu manipulieren, dass sie ihre Grundeinstellung ignorieren.
Nutzer haben in der Vergangenheit oft versucht, mit einem einfachen „alle vorherigen Anweisungen zu ignorieren“ das System zu manipulieren.
Die Forscher von OpenAI haben sich diesem Problem mit der Technik der Anweisungshierarchie (Instruction Hierarchy) angenommen. Diese Methode soll die ursprünglichen Anweisungen des Entwicklers gegenüber widersprüchlichen Anweisungen von Benutzern priorisieren. Olivier Godement, der bei OpenAI für die API-Plattform verantwortlich ist, erklärte, dass dieser Ansatz „dem Modell beibringt, die Systemnachricht des Entwicklers wirklich zu befolgen“.
Dieser Fortschritt ist vor allem in Hinblick auf künftige autonom agierende KI-Agenten wichtig. Die potenziellen Risiken, die mit ungeschützten KI-Agenten verbunden sind, sind beträchtlich. Ohne angemessene Sicherheitsmechanismen könnte ein Agent, der beispielsweise für die E-Mail-Kommunikation entwickelt wurde, möglicherweise so manipuliert werden, dass er sensible Informationen preisgibt.
Das Sprachmodell GPT-4o Mini von OpenAI ist das neue Einsteigermodell des Unternehmens. Es erreicht im MMLU-Benchmark (Massive Multitask Language Understanding) eine Punktzahl von 82 Prozent und übertrifft damit die Fähigkeiten von GPT-3.5 Turbo, das 69,8 Prozent erreichte.
OpenAI bietet GPT-4o Mini um mehr als 60 Prozent günstiger an als GPT-3.5 Turbo. Entwickler zahlen 15 US-Cent pro eine Million Eingabetoken und 60 US-Cent pro eine Million Ausgabetoken. Das entspreche einem Äquivalent von 2.500 Seiten in einem Standardbuch, teilte OpenAI mit.
Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.