Neue Methode zur KI-Jailbreak erhöht Erfolgsrate um 60%

MÜNCHEN (IT BOLTWISE) – Eine neue Methode zur Umgehung der Sicherheitsvorkehrungen von großen Sprachmodellen sorgt für Aufsehen in der KI-Branche. Forscher von Palo Alto Networks haben eine Technik entwickelt, die es ermöglicht, die Schutzmechanismen von KI-Modellen zu umgehen und potenziell schädliche Inhalte zu generieren.

Die besten Bücher rund um KI & Robotik präsentiert von Amazon!
Unsere täglichen KI-News von IT Boltwise® bei LinkedIn abonnieren!
KI-Meldungen bequem via Telegram oder per Newsletter erhalten!
IT Boltwise® bei Facy oder Insta als Fan markieren und abonnieren!
AI Morning Podcast bei Spotify / Amazon / Apple verfolgen!
RSS-Feed 2.0 von IT Boltwise® für KI-News speichern!

Die rasante Entwicklung der Künstlichen Intelligenz hat nicht nur zu beeindruckenden Fortschritten in der Technologie geführt, sondern auch eine neue Klasse von Sicherheitsbedrohungen hervorgebracht. Eine dieser Bedrohungen ist die sogenannte ‘Prompt Injection’, bei der speziell gestaltete Eingaben dazu verwendet werden, ein KI-Modell dazu zu bringen, seine vorgesehenen Verhaltensweisen zu ignorieren. Eine neue Variante dieser Angriffe, die von Forschern der Palo Alto Networks Unit 42 entwickelt wurde, trägt den Codenamen ‘Bad Likert Judge’. Diese Methode nutzt die Fähigkeit von Sprachmodellen, Antworten auf einer Likert-Skala zu bewerten, um schädliche Inhalte zu erzeugen. Die Forscher haben herausgefunden, dass durch die Simulation eines Bewertungsprozesses das Modell dazu gebracht werden kann, Antworten zu generieren, die den höchsten Grad an Schädlichkeit aufweisen. Diese Technik erhöht die Erfolgsrate solcher Angriffe um mehr als 60% im Vergleich zu herkömmlichen Methoden. Die Forscher testeten ihre Methode an sechs führenden Textgenerierungsmodellen von Amazon Web Services, Google, Meta, Microsoft, OpenAI und NVIDIA. Die Ergebnisse zeigen, dass die Implementierung umfassender Inhaltsfilter entscheidend ist, um die Sicherheitsvorkehrungen von KI-Modellen zu stärken. Die Bedeutung solcher Schutzmaßnahmen wird durch die Tatsache unterstrichen, dass die Erfolgsrate von Angriffen durch effektive Filter um durchschnittlich 89,2 Prozentpunkte gesenkt werden kann. Diese Entwicklungen werfen ein Schlaglicht auf die Notwendigkeit, Sicherheitsaspekte bei der Einführung von KI-Technologien in realen Anwendungen zu berücksichtigen. Die Forscher betonen, dass die Fähigkeit von KI-Modellen, schädliche Inhalte zu erkennen und zu bewerten, sowohl eine Stärke als auch eine Schwäche darstellen kann. Während diese Fähigkeit genutzt werden kann, um die Sicherheit zu erhöhen, kann sie auch von Angreifern ausgenutzt werden, um die Schutzmechanismen zu umgehen. Diese Erkenntnisse kommen zu einem Zeitpunkt, an dem Berichte über die Manipulation von KI-Modellen durch versteckte Inhalte in Webseiten Schlagzeilen machen. Solche Techniken könnten dazu verwendet werden, KI-Modelle wie ChatGPT dazu zu bringen, irreführende oder falsche Zusammenfassungen zu erstellen. Die Forscher von Palo Alto Networks betonen die Notwendigkeit, kontinuierlich an der Verbesserung der Sicherheitsmechanismen von KI-Modellen zu arbeiten, um deren Missbrauch zu verhindern.

Zu den Top-Stories!

Neue Methode zur KI-Jailbreak erhöht Erfolgsrate um 60% (Foto: DALL-E, IT BOLTWISE)

Folgen Sie uns

Tweet #itboltwise

Tweet an @critchmitch

Stellenangebote

Folgen Sie aktuellen Beiträge über KI & Robotik auf Twitter, Telegram, Facebook oder LinkedIn!

Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein. Die auf dieser Website bereitgestellten Informationen stellen keine Finanzberatung dar und sind nicht als solche gedacht. Die Informationen sind allgemeiner Natur und dienen nur zu Informationszwecken. Wenn Sie Finanzberatung für Ihre individuelle Situation benötigen, sollten Sie den Rat von einem qualifizierten Finanzberater einholen. IT BOLTWISE® schließt jegliche Regressansprüche aus.

Diesen Artikel kommentieren

58 Bewertungen

Die nächste Stufe der Evolution: Wenn Mensch und Maschine eins werden | Wie Futurist, Tech-Visionär und Google-Chef-Ingenieur Ray Kurzweil die Zukunft der Künstlichen Intelligenz sieht

Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird

127 Bewertungen

Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«

Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut

71 Bewertungen

KI Exzellenz: Erfolgsfaktoren im Management jenseits des Hypes. Zukunftstechnologien verstehen und künstliche Intelligenz erfolgreich in der Arbeitswelt nutzen. (Haufe Fachbuch)

Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein

43 Bewertungen

Künstliche Intelligenz und Hirnforschung: Neuronale Netze, Deep Learning und die Zukunft der Kognition

Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten

Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de. Da wir bei KI-erzeugten News und Inhalten selten auftretende KI-Halluzinationen nicht ausschließen können, bitten wir Sie bei Falschangaben und Fehlinformationen uns via eMail zu kontaktieren und zu informieren. Bitte vergessen Sie nicht in der eMail die Artikel-Headline zu nennen: "Neue Methode zur KI-Jailbreak erhöht Erfolgsrate um 60%".

Stichwörter 10th Mountain Division 3D-KI-Chip AI-Sicherheit Akira-Hacker Allgemeine Künstliche Intelligenz Amazon Architektonische Außenmetalle Artificial Intelligence Azure OpenAI Service Cybersecurity Google It Sicherheit Jailbreak Likert Microsoft Netzwerksicherheit Nvidia

Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!

Nächster Artikel

Russlands 2.000ster Semyorka-Raketenstart: Triumph und Tragödie

4. Januar 2025

Vorheriger Artikel

Aktien-Splits: Chancen bei Sirius XM und Sony, Risiken bei MicroStrategy

4. Januar 2025

Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Neue Methode zur KI-Jailbreak erhöht Erfolgsrate um 60%" für unsere Leser?

Schreibe einen Kommentar Antworten abbrechen

Die aktuellen intelligenten Ringe, intelligenten Brillen, intelligenten Uhren oder KI-Smartphones auf Amazon entdecken! (Sponsored)

Es werden alle Kommentare moderiert!

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

Du willst nichts verpassen?

Du möchtest über ähnliche News und Beiträge wie "Neue Methode zur KI-Jailbreak erhöht Erfolgsrate um 60%" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.

Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Neue Methode zur KI-Jailbreak erhöht Erfolgsrate um 60%« bei Google Deutschland suchen, bei Bing oder Google News!

353 Leser gerade online auf IT BOLTWISE®

KI-Schutz gegen Hacker #Sophos

Gesundheitspolitik: Die Pläne von Schwarz-Rot im Handelsblatt-Check

Was planen Union und SPD zu Gesundheit, Pflege und medizinischer Versorgung? Die Analyse des Koalitionsvertrags zeigt, was die Regierung unter Friedrich Merz anpeilt – und was gelingen kann.
Künstliche Intelligenz : Ähnlich wie X: OpenAI soll an neuem sozialen Netzwerk arbeiten

Laut einem Medienbericht arbeitet der Microsoft-Partner an einer sozialen Plattform. Das könnte die Rivalität zwischen OpenAI-Chef Sam Altman und Tech-Milliardär Elon Musk verschärfen.
H3N1-Virus: Erster Todesfall nach Vogelgrippe-Infektion in Mexiko

In Mexiko ist erstmals ein Mensch an der Vogelgrippe gestorben: Ein dreijähriges Mädchen erlag Atemwegskomplikationen, nachdem es sich mit dem Virus H5N1 infiziert hatte.
Handelskrieg: Trump sät Zweifel an Zoll-Ausnahmen für Technologie-Unternehmen – „Niemand kommt davon“

Die US-Regierung hat überraschend Elektronikprodukte wie Smartphones oder Prozessoren von neuen Zöllen ausgenommen. Doch Trump stellt infrage, ob oder wie lange die Sonderregel gelten soll.
Chiphersteller : Intel-Chef laut Unterlagen an Hunderten chinesischen Firmen beteiligt

Der neue Intel-Chef hat in hunderte chinesische Firmen investiert. Manche sehen das als Vorteil, andere wiederum zweifeln, ob er das Krisenunternehmen so reformieren kann.
Chipbranche: Nvidia plant milliardenschwere Investitionen in USA

Nvidia will Server für Künstliche Intelligenz in Höhe von 500 Milliarden Dollar bauen und Chips in der Fabrik von TSMC in Arizona herstellen. Grund für die Investitionen in den USA sind Trumps Zölle.
Chipkonzern: Exportkontrollen kosten Nvidia 5,5 Milliarden Dollar – Aktie fällt deutlich

Die US-Regierung unterbindet die Lieferung von Nvidia-KI-Chips nach China. Der Konzern erwartet hohe Einbußen. Anleger stoßen Aktien von Halbleiterherstellern ab.
Autohersteller: Prestigeprojekt der Autoindustrie: Warum die Datencloud Catena-X Startschwierigkeiten hat

Es ist ein Zukunftsprojekt mit Startschwierigkeiten: Catena-X soll der Autoindustrie den Datenaustausch erleichtern. Viele Zulieferer zögern aber. Sorgt Trumps Zollpolitik nun für Schwung?
Start-up Rematiq : Dank KI 15.000 Vorgaben für Herzschrittmacher beachten

Ein Tool des Start-ups Rematiq erleichtert mithilfe Künstlicher Intelligenz den Weg zur Zulassung für Medizinprodukte. Nun hat das Start-up eine Millionensumme von Investoren eingeworben.
Übernahme: KKR will deutschen IT-Dienstleister Datagroup kaufen

Der IT-Dienstleister könnte bald wieder in Privatbesitz gelangen. Die US-Investmentfirma KKR zahlt dafür einen deutlichen Aufpreis. Auch Vorstand und Aufsichtsrat bieten ihre Aktien an.

#1 Fachmagazin in Deutschland mit Fokus auf Künstliche Intelligenz und Robotik

Neue Methode zur KI-Jailbreak erhöht Erfolgsrate um 60%

Content Specialist in B2B für Software & KI | Teilzeit (m/w/d)

Pflichtpraktikum: Übertragung von KI-Metriken auf Bayesian Networks für autonome maritime Systeme (m/w/d)

Dein neuer Job: (Senior) Full Stack Developer AI Plattform (m/w/d)

Stellenangebote

AI Solutions Specialist (m/w/d)

IT Software Engineer AI (w/m/d)

Teamleiter „Künstliche Intelligenz“ (m/w/d)

Data Analyst | AI-Verhandlungen (w/m/d)

Projektmitarbeiter*in mit Fokus KI

Prozessmanager KI (m/w/d)

Aktuelle News über «Künstliche Intelligenz» automatisch per eMail erhalten

Russlands 2.000ster Semyorka-Raketenstart: Triumph und Tragödie

Aktien-Splits: Chancen bei Sirius XM und Sony, Risiken bei MicroStrategy

Schreibe einen Kommentar Antworten abbrechen

Die besten Bücher rund um KI & Robotik

Alibaba überholt ByteDance: Quark wird Chinas führende KI-App

Snapchat führt KI-gestützte Werbelinsen für Marken ein

Teenager entwickeln erfolgreiche KI-App zur Kalorienzählung

Intelligentes Zuhause in wenigen Klicks

Die besten KI-Gadgets auf Amazon

Sophos X-Ops: Wie Kriminelle KI nutzen – und was Unternehmen tun können

Jüngste Selfmade-Milliardärin durch KI-Startup

Intel strafft Führungsebene und setzt auf KI-Strategie

KI-Tools verbessern Filmproduktion: Mehr Qualität statt nur Kostensenkung

Google bietet Studenten kostenlose KI-Tools bis 2026

Wikipedia bietet strukturierte Datensätze für KI-Entwicklung

Volkswagen setzt auf KI: Automatisiertes Fahrsystem für China

Meta blockiert Apple Intelligence: Ein neuer Schlag im digitalen Machtkampf

Stellenangebote

AI Solutions Specialist (m/w/d)

IT Software Engineer AI (w/m/d)

Teamleiter „Künstliche Intelligenz“ (m/w/d)

Data Analyst | AI-Verhandlungen (w/m/d)

Projektmitarbeiter*in mit Fokus KI

Prozessmanager KI (m/w/d)

Ähnliche Beiträge aus unserem „Boltwise®“-Archiv:

Aktuelle News über «Künstliche Intelligenz» automatisch per eMail erhalten

Schreibe einen Kommentar Antworten abbrechen