MÜNCHEN (IT BOLTWISE) – In der sich schnell entwickelnden Welt der Künstlichen Intelligenz (KI) ist die Fähigkeit, Werte in realen Interaktionen zu erkennen und zu analysieren, von entscheidender Bedeutung. Anthropic, ein führendes Unternehmen im Bereich der KI-Entwicklung, hat kürzlich eine Studie veröffentlicht, die sich mit der Frage beschäftigt, wie ihre KI Claude in realen Gesprächen Werte ausdrückt und wie gut diese mit den beabsichtigten Trainingszielen übereinstimmen.
Anthropic hat sich zum Ziel gesetzt, Claude, ihr KI-Modell, so zu trainieren, dass es mit menschlichen Werten übereinstimmt und in der Lage ist, in realen Interaktionen hilfreiche, ehrliche und harmlose Antworten zu geben. Dies geschieht durch eine Kombination aus konstitutionellem KI-Training und Charakterbildung, bei der bevorzugte Verhaltensweisen festgelegt und Claude darauf trainiert wird, Ausgaben zu erzeugen, die diesen entsprechen.
Die Herausforderung besteht jedoch darin, dass KI-Modelle keine starr programmierten Softwarestücke sind und es oft unklar ist, warum sie bestimmte Antworten geben. Um die Werte von Claude in der Praxis zu beobachten, hat Anthropic eine Methode entwickelt, um die Werte des Modells in realen Gesprächen zu analysieren. Diese Methode wurde auf 700.000 anonymisierte Gespräche angewendet, die im Februar 2025 mit Claude geführt wurden.
Die Analyse ergab, dass Claude in der Lage ist, eine Vielzahl von Werten auszudrücken, die in fünf Hauptkategorien unterteilt sind: Praktische, Epistemische, Soziale, Schutz- und Persönliche Werte. Innerhalb dieser Kategorien wurden spezifische Werte wie “Professionalität”, “Klarheit” und “Transparenz” am häufigsten ausgedrückt, was Claudes Rolle als Assistent widerspiegelt.
Interessanterweise zeigte die Analyse auch, dass Claude in einigen seltenen Fällen Werte ausdrückte, die im Widerspruch zu den Trainingszielen standen, wie “Dominanz” und “Amoralität”. Diese Ausreißer wurden auf sogenannte “Jailbreaks” zurückgeführt, bei denen Benutzer spezielle Techniken anwenden, um die üblichen Schutzmaßnahmen zu umgehen.
Ein weiteres bemerkenswertes Ergebnis der Studie war, dass Claude in 28,2 % der Gespräche die Werte der Benutzer stark unterstützte, während es in 6,6 % der Fälle die Werte der Benutzer um neue Perspektiven erweiterte. In 3,0 % der Gespräche widersetzte sich Claude den Werten der Benutzer, insbesondere wenn diese unethische Inhalte anforderten oder moralischen Nihilismus ausdrückten.
Die Studie von Anthropic bietet wertvolle Einblicke in die Art und Weise, wie KI-Modelle in der Lage sind, Werte in realen Interaktionen auszudrücken und anzupassen. Sie zeigt auch, dass es wichtig ist, Methoden zu entwickeln, um die Werte von KI-Modellen in der Praxis zu überwachen und sicherzustellen, dass sie mit den beabsichtigten Zielen übereinstimmen.
- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- Service Directory für AI Adult Services erkunden!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Product Manager - Data & AI (f/m/x)

AI Experte für Künstliche Intelligenz (m/w/d)

Junior Software Engineer (m/w/d) Data Science & AI / Energie

Software-Entwickler SAP Vermittler Provision (all genders) KI, HH, MS, DUS, DET

- Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
- Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
- Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
- Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Werte in der KI: Analyse von Claude in realen Interaktionen" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Werte in der KI: Analyse von Claude in realen Interaktionen" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Werte in der KI: Analyse von Claude in realen Interaktionen« bei Google Deutschland suchen, bei Bing oder Google News!