31. Oktober 2023

Bewertung der Auswirkungen des EU-Vorschlags für ein AI-Gesetz

Mitwirkende
Michiel Van Lerbeirghe
Rechtsbeistand
Keine Artikel gefunden.
Newsletter abonnieren
Diesen Beitrag teilen

Wie können Modellanbieter die Vorschriften zu Ausbildungsdaten und Urheberrechten einhalten?

Basismodelle spielen eine zentrale Rolle als Grundlage vieler fortgeschrittener Systeme der künstlichen Intelligenz. Einfach ausgedrückt ist ein Basismodell ein groß angelegtes KI-Modell, das anhand großer Datenmengen trainiert wurde und als Grundlage für eine weitere Spezialisierung oder Anwendung in verschiedenen Bereichen dient. Ein herausragendes Beispiel für solche Systeme sind generative KI-Modelle, die in der Lage sind, selbstständig Inhalte zu produzieren, seien es Texte (wie ChatGPT), Bilder (wie Midjourney), Audio oder Video. 

Generative KI-Modelle sind naturgemäß auf umfangreiche Datensätze für das Training angewiesen. Diese Datensätze enthalten oft riesige Mengen an Bildern, Textfragmenten und anderen Daten, die aus verschiedenen Quellen stammen. Die schiere Menge und Vielfalt der Daten, die diese Modelle nutzen, kann manchmal die Herkunft der Daten überschatten, von denen einige möglicherweise urheberrechtlich geschützt sind.

Das EU-KI-Gesetz zielt auf die Regulierung von Basismodellen und generativen KI-Systemen ab. Gemäß einer der Verpflichtungen, die das Europäische Parlament in der aktuellen Fassung des Gesetzes auferlegt hat (der Text ist noch nicht fertiggestellt), sollten Anbieter von Basismodellen, die in generativen KI-Systemen verwendet werden, "dokumentieren und veröffentlichen. öffentlich verfügbar a ausreichend detaillierte Zusammenfassung der Verwendung von Ausbildungsdaten geschützt nach dem Urheberrechtsgesetz" (Abänderung 399, Artikel 28b des derzeitigen Textes). Mit anderen Worten: Unternehmen wie OpenAI (als Anbieter von ChatGPT) wären verpflichtet, die urheberrechtlich geschützten Daten, die sie zum Trainieren ihrer Modelle verwenden, zu dokumentieren und offenzulegen.

Das Ziel der Verpflichtung ist klar und logisch, nämlich für Transparenz zu sorgen und sicherzustellen, dass die Beteiligten Einblick in die Funktionsweise dieser einflussreichen KI-Systeme haben. Obwohl wir mehr Transparenz befürworten, werden wir in diesem Blogpost zwei Gründe anführen, warum sich die geplante Verpflichtung für viele Unternehmen, die an der Entwicklung und dem Einsatz dieser Art von Modellen arbeiten, als sehr schwierige (um nicht zu sagen unmögliche) Aufgabe erweisen könnte:

  1. Das Urheberrecht kann sehr weit gehen, und viele verschiedene Inhalte könnten potenziell urheberrechtlich geschützt sein (Bücher, Bilder, Textausschnitte, Designobjekte, das Design funktionaler Objekte, ...). Die Verpflichtung würde daher zu einem enormen Verwaltungsaufwand für die Anbieter von Stiftungsmodellen führen, da eine unglaublich große Menge an Inhalten dokumentiert und offengelegt werden müsste.

  2. Die Frage, ob die Voraussetzungen für den Urheberrechtsschutz erfüllt sind oder nicht, ist subjektiv, so dass die Anwendbarkeit des Urheberrechtsschutzes nicht vorhersehbar ist. Außerdem sind die Anbieter von Stiftungsmodellen nicht in der besten Position, um zu entscheiden, ob die Voraussetzungen erfüllt sind oder nicht.

Da die Folgen einer Nichteinhaltung zu empfindlichen Strafen führen könnten, sind wir der Meinung, dass, falls die Bestimmung tatsächlich angenommen werden sollte, weitere Leitlinien erforderlich sind, wie Anbieter von Stiftungsmodellen dieser Verpflichtung nachkommen können. 

Das Urheberrecht kann weit reichen

Der Urheberrechtsschutz gilt für"Werke der Kunst und Literatur", ein autonomer Begriff des Unionsrechts, der in der gesamten Europäischen Union einheitlich auszulegen ist.

Für die Auslegung des Begriffs müssen wir die Rechtsprechung des Gerichtshofs der Europäischen Union (EuGH) heranziehen. Nach der Rechtsprechung können wir von einem geschützten Werk sprechen, wenn zwei Bedingungen erfüllt sind: (1) das Werk muss originell sein und (2) es muss einen Ausdruck haben (z. B. EuGH 12. September 2019, Cofemel, C-683/17, Rn. 29):

  1. Erstens setzt der Begriff "Werk" voraus, dass ein originärer Gegenstand im Sinne einer eigenen geistigen Schöpfung des Urhebers vorhanden ist.

Nach ständiger Rechtsprechung des Gerichtshofs kann ein Gegenstand nur dann als originell angesehen werden, wenn er die Persönlichkeit seines Urhebers als Ausdruck seiner freien und schöpferischen Entscheidungen widerspiegelt (vgl. z. B. EuGH, 1. Dezember 2011, Painer, C-145/10, Randnrn. 88, 89 und 94).

  1. Zweitens ist die Einstufung als Werk den Elementen vorbehalten, die Ausdruck einer solchen geistigen Schöpfung sind. Es muss möglich sein, den Gegenstand klar und genau zu identifizieren, ohne dass er ein subjektives Element enthält. Diese Voraussetzung ist beispielsweise der Grund dafür, dass "ein Geschmack" nicht urheberrechtlich geschützt werden kann, da ein Geschmack subjektiv ist und nicht objektiv identifiziert werden kann (EuGH 13. November 2018, Levola Hengelo, C-310/17, Randnrn. 33 und 35 bis 37).

Wenn ein Gegenstand diese beiden europäischen Bedingungen erfüllt, wird er durch das Urheberrecht geschützt. Diese Bedingungen sind ausreichend, was bedeutet, dass keine weiteren Bedingungen für den Schutz gestellt werden dürfen, so dass Begriffe wie "Neuheit", "Erfindungsreichtum", "ästhetischer oder künstlerischer Charakter" oder "ein gewisses Maß an Aufwand oder Fachwissen" für die Entscheidung, ob ein Gegenstand urheberrechtlich geschützt ist oder nicht, irrelevant sind. 

Unter diesen europäischen Bedingungen kann eine Vielzahl von Gegenständen als Werk im Sinne des Urheberrechts angesehen werden. Beispiele aus der Rechtsprechung zeigen, dass der Urheberrechtsschutz weit reichen kann und dass der Begriff "Werk" weit ausgelegt wird (neben den offensichtlichen Gegenständen wie Bücher, Bilder, Musikwerke, Videos usw.):

  • So hat beispielsweise ein belgisches Gericht bereits entschieden, dass ein Leitfaden für die Benutzung von IT-Geräten urheberrechtlich geschützt ist (Berufungsgericht Brüssel, 28. Januar 1997).

  • Oder, so der EuGH, elf aufeinanderfolgende Wörter können ein "Werk" und damit urheberrechtlich geschützt sein (EuGH 16. Juli 2009, Infopaq, C-5/08).

  • Und auch die Gestaltung von sehr funktionalen Gegenständen kann als Werk der Kunst und Literatur angesehen werden. In der Rechtsprechung wurde zum Beispiel entschieden, dass das unten abgebildete Design (die Halterung eines Waffeleisens) urheberrechtlich geschützt ist (Berufungsgericht Brüssel, 25. Oktober 2011, Nr. 2011/AR/119):

Der breite Schutzbereich hat zur Folge, dass die vorgesehene Verpflichtung des AI-Gesetzes sehr umfangreich sein könnte, was zu einem extremen Verwaltungsaufwand führt. Beispielsweise könnte bei einem Bild eines funktionalen Gegenstands sowohl (i) das Bild als solches als auch (ii) das Design des funktionalen Gegenstands urheberrechtlich geschützt sein. 

Es versteht sich von selbst, dass ein Anbieter von generativen KI-Systemen eine enorme Aufgabe bei der Dokumentation und Offenlegung von Informationen über den urheberrechtlich geschützten Gegenstand hätte, da er weiß, dass ein generatives KI-System auf Millionen von Bildern, Textfragmenten, Zeichnungen, Büchern usw. trainiert werden kann.

Urheberrecht ist subjektiv

Das bedeutet, dass es auch kein Urheberrechtsregister gibt, das die Anbieter von generativen KI-Systemen konsultieren könnten, um zu prüfen, ob bestimmte Daten urheberrechtlich geschützt sind oder nicht.

In der Praxis muss ein Richter (in der Regel im Rahmen eines Rechtsstreits) entscheiden , ob ein bestimmtes Werk die Voraussetzungen erfüllt oder nicht. Dabei obliegt es auch dem vermeintlichen Rechteinhaber, zu beweisen, dass es sich bei dem Gegenstand um ein Werk der Kunst und Literatur handelt.

Wir stellen fest, dass die Auslegung der Bedingungen sehr subjektiv ist, so dass die Anwendbarkeit des Urheberrechtsschutzes nicht vorhersehbar ist.

Die folgenden Beispiele zeigen, dass die Bewertung in beide Richtungen gehen kann:

  • In einem Fall, in dem es um Bilder von Fußballspielern und Fußballspielen ging (Porträtbilder, Bilder von Spielern in Aktion, Bilder der Stadien und der Atmosphäre), entschied das Brüsseler Berufungsgericht, dass diese Art von Bildern urheberrechtlich geschützt ist, weil der Fotograf mehrere freie und kreative Entscheidungen in Bezug auf die Bilder treffen konnte, z. B. in Bezug auf den Bildwinkel, den Blickwinkel, die Beleuchtung, das Timing des Bildes, die Einstellung der Kamera und so weiter. Der Fotograf hat also bei der Anfertigung der Bilder "freie und kreative Entscheidungen" getroffen, was bedeutet, dass diese originell sind (Berufungsgericht Brüssel, 3. Oktober 2017, Nr. 2013/AR/860).

  • In einem anderen Fall entschied das Berufungsgericht Gent jedoch, dass die auf einer bestimmten Immobilien-Website verwendeten Bilder sowie die begleitenden Texte, die die Immobilien beschreiben, nicht urheberrechtlich geschützt sind. Das Gericht entschied, dass Bilder zwar potenziell geschützt werden können, die Originalität in diesem speziellen Fall aber nicht nachgewiesen wurde (Berufungsgericht Gent, 25. Juni 2018, Nr. 2016/AR/470).

  • Und selbst zu ein und demselben Thema kann ein anderes Gericht beispielsweise eine andere Meinung vertreten: 

  • Mehrere Gerichte haben bereits entschieden, dass das Design der Handtasche Le Pliage von Longchamp urheberrechtlich geschützt ist (u. a. Berufungsgericht Brüssel am 18. Mai 2006, Nr. 2003/AR/880 und am 20. April 2012, Nr. 2012/AR/2910), während es auch Rechtsprechung gibt, die besagt, dass das Design nicht geschützt ist (Berufungsgericht Gent, 20. Oktober 2014, Nr. 2013/AR/1945).

  • Oder in Bezug auf das folgende Objekt wurde in erster Instanz entschieden, dass das Design urheberrechtlich geschützt ist (Handelsgericht Gent, 11. Januar 2018, Nr. A/16/02910), während das Berufungsgericht entschied, dass dies nicht der Fall ist (Berufungsgericht Gent, 1. Februar 2021, Nr. 2018/AR/254):

Die obigen Beispiele zeigen, dass der Urheberrechtsschutz sehr subjektiv ist und dass sogar die Richter unterschiedliche Meinungen zum Thema haben können. 

Es liegt auf der Hand, dass es für einen Anbieter von generativen KI-Systemen sehr schwierig ist, zu beurteilen, ob bestimmte Daten urheberrechtlich geschützt sind oder nicht, wenn sogar die Meinungen der Richter voneinander abweichen können. Dies gilt umso mehr, wenn es kein Urheberrechtsregister gibt, in dem dies überprüft werden kann. 

Fazit

Selbstverständlich sprechen wir uns für mehr Datentransparenz für Anbieter von Stiftungsmodellen aus. So unterstützen wir beispielsweise voll und ganz die Idee, Stiftungsmodelle zu regulieren, und die vorgesehenen Transparenzverpflichtungen zur Offenlegung der Berechnungen (Modellgröße, Computerleistung, Trainingszeit), der Fähigkeiten und Grenzen des Modells, der Ergebnisse interner und externer Tests usw. Obwohl die Bestimmung über die Transparenz in Bezug auf urheberrechtlich geschütztes Material ebenfalls logisch ist, glauben wir, dass die derzeitige Bestimmung aus den in diesem Blogpost genannten Gründen in der Praxis schwer einzuhalten ist.

Sollte die Vorschrift tatsächlich umgesetzt werden, sind unserer Ansicht nach weitere Hinweise erforderlich, wie die Anbieter die vorgesehene Verpflichtung des AI-Gesetzes tatsächlich erfüllen können. 

Darüber hinaus wäre es wünschenswert, wenn der Begriff der "hinreichend ausführlichen Zusammenfassung" besser ausgelegt werden könnte. Es stellt sich die Frage, wie ausführlich die Offenlegung sein muss und was unter einer Zusammenfassung zu verstehen ist.

Die Bedeutung und der Bedarf an Leitlinien liegt auf der Hand, denn die Nichteinhaltung der neuen Bestimmungen kann dazu führen, dass Anbieter von generativen KI-Systemen haftbar gemacht werden können, wenn keine ausreichenden Zusammenfassungen der Trainingsdatensätze vorhanden sind. Die Nichteinhaltung dieser Offenlegungspflichten könnte zu potenziellen Geldbußen von bis zu 10 Mio. EUR oder 2 % des Jahresumsatzes führen, je nachdem, welcher Betrag höher ist.

Verwandte Beiträge

Alle anzeigen
Keine Ergebnisse gefunden.
Es gibt keine Ergebnisse mit diesen Kriterien. Versuchen Sie, Ihre Suche zu ändern.
Großes Sprachmodell
Stiftung Modelle
Unternehmen
Unser Team
Strukturierte Daten
Chat GPT
Nachhaltigkeit
Stimme und Ton
Front-End-Entwicklung
Schutz und Sicherheit von Daten
Verantwortungsvolle/ethische KI
Infrastruktur
Hardware und Sensoren
MLOps
Generative KI
Verarbeitung natürlicher Sprache
Computer Vision