Nutzungsrecht-Klage gegen ChatGPT: OpenAI löscht Beweismittel (versehentlich)

Auf Großen Sprachmodellen (LLMs) aufgebaute KIs haben keinen Verstand; stattdessen berechnen sie die wahrscheinlichste Antwort auf eine Frage. Um dies zu bewerkstelligen, brauchen sie eine Unmenge von Trainingsdaten. Darüber, ob OpenAI im Netz verfügbare journalistische Inhalte für die LLM-Entwicklung nutzen darf, wird gerichtlich gestritten: Die Tageszeitungen "New York Times" sowie "Daily News" haben deshalb den ChatGPT-Entwickler wegen Urheberrechtsverletzung verklagt. Nach einem von OpenAI verschuldeten IT-Vorfall wurde ein großer Teil der Rechercheergebnisse gelöscht, schreiben die Anwälte der Klägerseite in einem Brief an die Richter.

Um herauszufinden, ob ihre im Trainingsmaterial des KI-Anbieters überhaupt vorhanden ist, waren die Klagenden auf Kooperation von OpenAI angewiesen: Der Konzern richtete zwei Virtuelle Maschinen ein, in denen sich das verwendete Trainingsmaterial durchsuchen ließ. Über 150 Stunden seien in die Durchforstung des Materials geflossen; deren Ergebnisse wurden versehentlich gelöscht. Zwar war OpenAI in der Lage, die Inhalte der Dokumente wiederherstellen. Da bei der Wiederherstellung der Daten allerdings sämtliche Dateinamen und Ordnerstrukturen verloren gingen, seien diese nicht als Beweismittel geeignet, argumentierten die Anwälte. Nun mussten sie die Arbeit einer ganzen Woche erneut aufwenden.

Wohl unabsichtlich
Das Schreiben betont, dass sie in der Datenlöschung keine Absicht vermuteten; allerdings sei OpenAI selbst viel besser in der Lage, das eigene Material nach Material aus dem Klägerfundus zu durchforsten. Den Bitten der Kläger, bestimmte Inhalte selbstständig im Trainingsmaterial aufzuspüren, sei der KI-Anbieter bisher nicht nachgekommen. Das Ziel des Schreibens: Das Gericht solle den Angeklagten dazu verpflichten, eigenständig offenzulegen, welche Inhalte der Kläger im Trainingsdatensatz vorhanden sind.

OpenAI streitet Nutzung nicht ab
Tatsächlich bestreitet OpenAI nicht, Inhalte der beiden Medienkonzerne zu verwenden; vielmehr verteidigt sich das Unternehmen mit der Argumentation, dass ihre Nutzung den "Fair-Use"-Prinzipien entspreche. Diese Ausnahme im US-amerikanischen Urheberrecht räumt jedem das Zitieren eines Werks ein, sofern dies zu bestimmten Zwecken erfolge – etwa für eine journalistische Berichterstattung, kritische Auseinandersetzung oder Satire. Diese Regelung wurde in den letzten Jahrzehnten unterschiedlich ausgelegt. Ob das Trainieren eines LLMs als Fair Use gilt oder OpenAI erst eine Lizenzierung beantragen müsste, wird nun in wahrscheinlich mehrjährigen Gerichtsverhandlungen geklärt.

Kommentare

aMacUser22.11.24 19:59

MTN

Ob das Trainieren eines LLMs als Fair Use gilt oder OpenAI erst eine Lizenzierung beantragen müsste, wird nun in wahrscheinlich mehrjährigen Gerichtsverhandlungen geklärt.

Die zugrundeliegende Frage dürfte vermutlich sein, ob "Fair Use" gilt, wenn man die Daten nutzt, um damit Profit zu generieren. Noch ist OpenAI ja eine gemeinnützige Organisation, wodurch es aufgrund der Rechtsform nicht um Profit geht. Aber genau diese Gemeinnützigkeit wollen die ja jetzt loswerden.

-1

MTB23.11.24 01:12

Ein Beweis für die Intelligenz der KI?

typneun23.11.24 01:20

Versehentlich.
Genau mein Humor.

Weia23.11.24 02:27

aMacUser

Die zugrundeliegende Frage dürfte vermutlich sein, ob "Fair Use" gilt, wenn man die Daten nutzt, um damit Profit zu generieren.

Nein, das hat überhaupt nichts miteinander zu tun. Journalistische Berichterstattung, kritische Auseinandersetzung und Satire, die als Fair Use gelten, finden ja mehrheitlich in Zeitungen und Büchern statt, die kommerziell mit Gewinnabsicht vertrieben werden.

“I don’t care” is such an easy lie. (The Warning, “Satisfied”)

Nutzungsrecht-Klage gegen ChatGPT: OpenAI löscht Beweismittel (versehentlich)

Kommentare

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.