Claude-Modelle von Anthropic: Offenlegung der System-Prompts für mehr Transparenz - IT BOLTWISE® x Artificial Intelligence

MÜNCHEN (IT BOLTWISE) – Anthropic setzt neue Maßstäbe in der KI-Branche mit der Veröffentlichung der System-Prompts seiner Claude-Modelle.



Anthropic, ein aufstrebendes Unternehmen in der KI-Industrie, hat kürzlich die System-Prompts für seine Claude-Familie von KI-Modellen veröffentlicht und sich verpflichtet, dies auch in Zukunft fortzusetzen. Diese Maßnahme wird von Branchenbeobachtern als ein neuer Standard für Transparenz in der schnelllebigen Welt der generativen Künstlichen Intelligenz (KI) angesehen.

System-Prompts fungieren ähnlich wie Betriebsanweisungen für große Sprachmodelle (LLMs), indem sie diesen die allgemeinen Regeln vorgeben, die sie bei der Interaktion mit Nutzern befolgen sollen, sowie die Verhaltensweisen oder Persönlichkeiten, die sie darstellen sollen. Außerdem geben sie häufig das Datum an, bis zu dem das LLM während des Trainings Informationen erlernt hat.

Obwohl die meisten LLMs über solche System-Prompts verfügen, veröffentlicht nicht jedes KI-Unternehmen diese öffentlich. Tatsächlich ist es zu einem Hobby für einige geworden, die System-Prompts von Modellen zu entschlüsseln. Doch nun hat Anthropic diese „Jailbreaker“ übertroffen, indem es die Betriebsanweisungen seiner Modelle Claude 3.5 Sonnet, Claude 3 Haiku und Claude 3 Opus auf seiner Website im Bereich der Versionshinweise offen zugänglich gemacht hat.

Zusätzlich hat Alex Albert, Leiter der Entwicklerbeziehungen bei Anthropic, auf X (ehemals Twitter) eine Verpflichtung zur kontinuierlichen Aktualisierung der öffentlichen System-Prompts angekündigt: „Wir werden Änderungen an den Standard-System-Prompts auf Claude.ai und unseren mobilen Apps protokollieren und öffentlich zugänglich machen.“

Was die System-Prompts von Anthropic verraten

Die veröffentlichten System-Prompts für die drei Modelle – Claude 3.5 Sonnet, Claude 3 Haiku und Claude 3 Opus – offenbaren einige interessante Details über ihre jeweiligen Fähigkeiten, das Wissensstanddatum und verschiedene Persönlichkeitsmerkmale.

Claude 3.5 Sonnet ist die fortschrittlichste Version und verfügt über eine Wissensbasis, die bis April 2024 aktualisiert wurde. Es liefert detaillierte Antworten auf komplexe Fragen und prägnante Antworten auf einfachere Aufgaben, wobei sowohl auf Genauigkeit als auch auf Kürze Wert gelegt wird. Dieses Modell geht vorsichtig mit kontroversen Themen um, präsentiert Informationen, ohne sie als sensibel zu kennzeichnen oder den Anspruch auf Objektivität zu erheben. Darüber hinaus vermeidet Claude 3.5 Sonnet unnötige Füllphrasen oder Entschuldigungen und ist besonders darauf bedacht, bei der Bilderkennung keine Gesichter zu erkennen.

Claude 3 Opus arbeitet mit einer Wissensbasis, die bis August 2023 aktualisiert ist, und zeichnet sich durch seine Fähigkeit aus, komplexe Aufgaben und Schreibaufträge zu bewältigen. Es ist darauf ausgelegt, prägnante Antworten auf einfache Anfragen und ausführliche Antworten auf komplexere Fragen zu geben. Claude 3 Opus behandelt kontroverse Themen, indem es eine breite Palette von Perspektiven bietet, Stereotypen vermeidet und ausgewogene Ansichten vermittelt. Während es einige Ähnlichkeiten mit dem Sonnet-Modell aufweist, enthält es nicht dieselben detaillierten Verhaltensrichtlinien, wie das Vermeiden von Entschuldigungen oder unnötigen Bestätigungen.

Claude 3 Haiku ist das schnellste Modell der Claude-Familie, ebenfalls aktualisiert bis August 2023. Es ist optimiert, um schnelle, prägnante Antworten auf einfache Fragen zu liefern, bietet aber auch bei Bedarf ausführliche Antworten auf komplexere Fragen. Die Struktur des Prompts für Haiku ist im Vergleich zu Sonnet einfacher und konzentriert sich in erster Linie auf Geschwindigkeit und Effizienz, ohne die fortgeschrittenen Verhaltensnuancen des Sonnet-Modells.

Warum die Veröffentlichung der System-Prompts durch Anthropic wichtig ist

Ein häufig geäußerter Kritikpunkt an generativen KI-Systemen ist das Konzept der „Black Box“, bei dem es schwierig ist, nachzuvollziehen, warum und wie ein Modell zu einer Entscheidung gelangt ist. Dieses Problem der Black Box hat zur Forschung im Bereich der KI-Erklärbarkeit geführt, einem Ansatz, der versucht, Licht in den prädiktiven Entscheidungsprozess von Modellen zu bringen. Der öffentliche Zugang zu System-Prompts ist ein Schritt in Richtung einer Öffnung dieser Black Box, jedoch nur insoweit, wie die Menschen die von den KI-Unternehmen festgelegten Regeln für die von ihnen erstellten Modelle verstehen.

KI-Entwickler begrüßten die Entscheidung von Anthropic und betonten, dass die Veröffentlichung der Claude-System-Prompts und die Updates dazu unter den KI-Unternehmen herausstechen.

Keine vollständige Open-Source-Strategie

Die Veröffentlichung der System-Prompts für die Claude-Modelle bedeutet nicht, dass Anthropic die Modellfamilie vollständig geöffnet hat. Der tatsächliche Quellcode für den Betrieb der Modelle sowie der Trainingsdatensatz und die zugrunde liegenden „Gewichte“ (oder Modelleinstellungen) bleiben allein in den Händen von Anthropic.

Dennoch zeigt die Veröffentlichung der Claude-System-Prompts anderen KI-Unternehmen einen Weg zu mehr Transparenz in der Entwicklung von KI-Modellen auf. Es kommt auch den Nutzern zugute, indem es ihnen zeigt, wie ihr KI-Chatbot agieren soll.

Claude-Modelle von Anthropic: Offenlegung der System-Prompts für mehr Transparenz
Claude-Modelle von Anthropic: Offenlegung der System-Prompts für mehr Transparenz (Foto: DALL-E, IT BOLTWISE)
Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein.



Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de
Stichwörter
Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!


#Abo
LinkedIn
Facebook
Twitter
#Podcast
YouTube
Spotify
Apple

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert



Es werden alle Kommentare moderiert!

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

Du willst nichts verpassen?

Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.