Psychologe nutzt Gaslighting, um KI-Sicherheitsfilter zu umgehen
MÜNCHEN (IT BOLTWISE) – In der Welt der Künstlichen Intelligenz (KI) gibt es immer wieder neue Herausforderungen, insbesondere wenn es um die Sicherheit und den Schutz sensibler Informationen geht. Der deutsche Psychologe Luke Bölling hat kürzlich eine Methode entwickelt, um Sicherheitsrichtlinien von Large Language Models (LLMs) zu umgehen, indem er psychologische Tricks anwendet, die ursprünglich […]