NEW YORK / MÜNCHEN (IT BOLTWISE) – Eine von der New York Times eingereichte Klage gegen OpenAI und Microsoft könnte richtungsweisend für die Zukunft des Urheberrechts und der künstlichen Intelligenz werden. Die Klage wirft grundlegende Fragen zur Funktionsweise von Large-Language-Modellen und den rechtlichen Rahmenbedingungen der KI-Entwicklung auf. Während die Times Urheberrechtsverletzungen geltend macht, beleuchtet die Debatte tiefere Aspekte der KI-Innovation und ihres Potenzials für die Gesellschaft.
Die New York Times (NYT) steht im Mittelpunkt einer wegweisenden Klage gegen OpenAI und Microsoft, in der schwere Vorwürfe der Urheberrechtsverletzung erhoben werden. Die Klage, die im Bundesbezirksgericht Manhattan eingereicht wurde, beschuldigt beide Unternehmen, „Millionen“ von Artikeln der Times kopiert und genutzt zu haben, um ihre künstlichen Intelligenz-Modelle zu trainieren, die nun direkt mit dem Nachrichtenoutlet konkurrieren.
Standpunkt und Anklagepunkte der New York Times
Die Anklage hebt die Verwendung von NYT-Inhalten zum Training von Large-Language-Modellen hervor, die ChatGPT und Microsofts Copilot zugrunde liegen, die Inhalte der Times nahezu wörtlich wiedergeben oder ihren expressiven Stil nachahmen könnten. Dies, so die Times, untergrabe und beschädige ihre Beziehung zu den Lesern und bringe den Verlag um wichtige Einnahmequellen wie Abonnements und Werbung.
Zusätzlich zur finanziellen Entschädigung fordert die Times von den Unternehmen, alle Chatbot-Modelle und Trainingsdaten zu vernichten, die urheberrechtlich geschütztes Material der Times verwenden. Die Klage wirft auch Bedenken auf, dass KI-Modelle hochwertigen Journalismus bedrohen, indem sie die Fähigkeit von Nachrichtenorganisationen, ihre Inhalte zu schützen und zu monetarisieren, beeinträchtigen.
Die Klage zitiert auch mehrere Fälle, in denen Chatbots der Beklagten falsche Informationen lieferten, die fälschlicherweise der Times zugeschrieben wurden, was potenziell die Glaubwürdigkeit der Marke Times beschädigen könnte.
Während OpenAI durch die Klage als profitorientiert und verschlossen dargestellt wird, steht die gesellschaftliche Bedeutung des unabhängigen Journalismus im Kontrast dazu. Die Verwendung von KI in Nachrichtenmedien wird jedoch als potenzieller Konkurrent im Nachrichtenbusiness angesehen.
Die Klage beleuchtet weiterhin, wie die Veröffentlichung der auf Times-Inhalten trainierten KI-Modelle sich für OpenAI und Microsoft als „äußerst lukrativ“ erwiesen hat, und hebt hervor, dass vergebliche Verhandlungsversuche mit beiden Unternehmen zu keinem Ergebnis führten.
Die New York Times ist eine von vielen Nachrichtenagenturen, die in den letzten Monaten den Webcrawler von OpenAI blockiert haben, um zu verhindern, dass das Unternehmen weiterhin Inhalte von ihrer Website für das Training von KI-Modellen verwendet. Dies steht im starken Kontrast zu anderen Medienhäusern wie Axel Springer, die Vereinbarungen über die Nutzung ihres Journalismus mit OpenAI getroffen haben.
Die Klage weist darauf hin, dass die Beklagten auf den massiven Investitionen der Times in ihren Journalismus aufbauen, ohne entsprechende Gegenleistung zu erbringen, und Produkte schaffen, die als Ersatz für die Times dienen und ihr Publikum abwerben könnten.
Die Klage zielt auch darauf ab, die KI-Modelle als direkte Konkurrenz zu etablierten Medien darzustellen. Dies steht jedoch im Widerspruch zu der Art und Weise, wie KI-Technologie genutzt wird, nämlich als ergänzendes Werkzeug und nicht als Ersatz für menschlichen Journalismus. Es gibt Bedenken, dass ein Erfolg der Klage zu einer Beschränkung der Entwicklung und Verbreitung von KI-Technologien führen könnte, was wiederum negative Auswirkungen auf die Zukunft der Informationsverbreitung und Innovation haben könnte.
Ein weiterer strittiger Punkt ist die Forderung der Times, dass OpenAI und Microsoft alle Modelle und Trainingsdaten vernichten, die urheberrechtlich geschütztes Material der Times verwenden. Angesichts der Komplexität und des Umfangs der Daten, die zur Trainierung dieser Modelle verwendet werden, erscheint diese Forderung sowohl technisch als auch rechtlich problematisch.
Zudem wird die Rolle von OpenAI als profitorientiertes Unternehmen kritisch betrachtet, insbesondere angesichts der öffentlichen Wahrnehmung von OpenAI als gemeinnützige Organisation. Dies könnte das Image von OpenAI in der öffentlichen Meinung und vor Gericht beeinflussen.
Die Klage der NYT hebt auch den potenziellen Schaden für ihre Marke durch die sogenannten KI-„Halluzinationen“ hervor, ein Phänomen, bei dem KI-Systeme falsche Informationen generieren. Dies ist jedoch ein allgemeines Risiko bei der Verwendung von KI-Technologie und nicht spezifisch ein Problem der Modelle von OpenAI oder Microsoft.
Infragestellung der Konsistenz der Klage und Zukunft der KI-Entwicklung
Andererseits gibt es auch Stimmen, die vor den möglichen Gefahren für die Zukunft der KI-Technologie und damit für die Menschheit insgesamt warnen. Diese Perspektive betont, dass die Klage das Gleichgewicht zwischen dem Schutz des geistigen Eigentums und der Förderung technologischer Innovationen gefährden könnte.
Die Anklagepunkte basieren auf der Behauptung, dass die Ausgaben von ChatGPT und Microsofts KI-Modellen inhaltlich den Artikeln der Times ähneln. Dies wirft jedoch Fragen hinsichtlich der Definition von Urheberrechtsverletzungen in Bezug auf KI-generierte Inhalte auf. Ein zentraler Punkt der Debatte ist, ob die Nutzung eines umfangreichen Datensatzes wie des Common Crawl, der Artikel der NYT beinhaltet, als Urheberrechtsverletzung zu werten ist, insbesondere da generative KI-Modelle keine exakten Kopien, sondern derivative Werke erstellen.
Die Kernfrage der Klage betrifft das Verständnis der Funktionsweise von Large Language Models (LLMs). LLMs speichern nicht den zugrundeliegenden Trainingstext; sie sind vielmehr darauf trainiert, auf der Grundlage eines riesigen Textkorpus (beispielsweise des gesamten Internets) Wahrscheinlichkeitsverteilungen für das nächste Wort zu erlernen. Kein Text wird direkt aus dem Internet „memorisiert“.
Diese Funktionsweise führt dazu, dass häufig wiederholte, ungewöhnliche Texte leicht vorhergesagt werden können. Das Problem der „Halluzinationen“, bei denen KI-Systeme falsche Informationen generieren, entsteht, weil LLMs keine Fakten „kennen“, sondern nur Wahrscheinlichkeitsverteilungen für das nächste Wort. Die Anklageschrift beinhaltet eine Sektion, die auf von diesen „Halluzinationen“ ausgehende „Misinformationen“ abzielt. Dieses Argument, auch wenn nur nebensächlich zu den Hauptklagepunkten, steht in direktem Konflikt zu den Vorwürfen des Plagiarismus.
Die Klage der NYT könnte weitreichende Auswirkungen auf die generelle Innovationslandschaft Künstlicher Intelligenz und den Schutz kreativer Inhalte haben. Eine Überbetonung des Urheberrechtsschutzes auf Kosten der technologischen Entwicklung könnte die KI-Forschung und -Anwendung einschränken. Urheberrecht dient dem Gemeinwohl, um Anreize für Tätigkeiten zu schaffen, die der Gesellschaft insgesamt zugutekommen. Die Argumentation, dass die Klage auf privaten wirtschaftlichen Interessen beruht, könnte als Missachtung des eigentlichen Zwecks des Urheberrechts gesehen werden. Die Technologiebranche folgt denselben Regeln und Normen wie andere Wirtschaftsbereiche. Eine ungünstige gerichtliche Entscheidung in diesem Fall könnte die Entwicklung von LLMs erheblich behindern, da sie nicht in der Lage wären, korrekte Fakten aus „seltenen“ Quellen zu erlernen, ohne häufig vorkommende Textpassagen zu reproduzieren.
Ausblick und Fazit
Die Klage der New York Times gegen OpenAI und Microsoft ist ein Präzedenzfall, der die rechtlichen Rahmenbedingungen für generative KI-Technologien neu definieren könnte. Es geht nicht nur um die Weiterentwicklung der KI-Innovation, sondern auch um den Schutz kreativer Werke. Die Entscheidung wird weitreichende Auswirkungen auf die Zukunft der KI-Innovation und den Schutz kreativer Inhalte haben. Es wird interessant zu sehen, welche Argumentationswege Anklage und Verteidigung gehen, und wie sich Jury und Richter verhalten werden, falls keine Einigung erreicht wird und es zu einem Prozess kommt.
Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.