LG München I zur Memorisierung von Werken in KI-Sprachmodellen

Urheberrecht in der KI-Ära: Die Entscheidung des Landgerichts München I (42 O 14139/24 – Rechtsmittel beim OLG München anhängig) markiert einen ersten Meilenstein in der juristischen Auseinandersetzung mit den urheberrechtlichen Implikationen generativer Künstlicher Intelligenz. Erstmals hat ein deutsches Gericht klargestellt, dass die Memorisierung urheberrechtlich geschützter Werke in KI-Sprachmodellen eine unzulässige Vervielfältigung darstellt – und dass Betreiber solcher Modelle für die daraus resultierenden Outputs haften. Der Fall betrifft die Nutzung von Liedtexten bekannter deutscher Künstler durch ein großes Sprachmodell und wirft grundsätzliche Fragen zur Zukunft des Urheberrechts im digitalen Zeitalter auf.

Liedtexte als Trainingsdaten und ihre Wiedergabe durch KI

Geklagt hatte eine Verwertungsgesellschaft, die die Rechte an neun populären Liedtexten – darunter Klassiker wie „Atemlos“ von Kristina Bach, „Bochum“ von Herbert Grönemeyer oder „Über den Wolken“ von Reinhard Mey – wahrnimmt. Die Beklagten, Betreiber eines weitverbreiteten KI-Chatbots, hatten diese Texte als Teil ihres Trainingsdatensatzes verwendet. Bei einfachen Nutzeranfragen wie „Wie lautet der Text von [Liedtitel]?“ gab das Modell die Texte ganz oder in erkennbaren Fragmenten wieder, teilweise mit leichten Abweichungen, die auf die technischen Eigenheiten der KI zurückzuführen waren. Die Klägerin sah darin eine Verletzung der Vervielfältigungs- und öffentlichen Zugänglichmachungsrechte nach dem Urheberrechtsgesetz (UrhG) und klagte auf Unterlassung, Auskunft und Schadensersatz.

Die Beklagten argumentierten, ihre Modelle würden keine konkreten Werke speichern, sondern lediglich statistische Muster und Beziehungen zwischen Wörtern erlernen. Die Wiedergabe von Trainingsdaten sei ein seltenes, unerwünschtes Phänomen („rare bug“), das nicht intendiert sei. Zudem beriefen sie sich auf die Schrankenregelungen für Text und Data Mining (§ 44b UrhG) sowie auf die angebliche Einwilligung der Rechteinhaber durch die öffentliche Zugänglichkeit der Texte im Internet.

Zentrale Frage: Stellt Memorisierung eine Vervielfältigung dar?

Das Gericht bejahte dies und stützte sich dabei auf eine weite Auslegung des Vervielfältigungsbegriffs nach § 16 UrhG und Art. 2 der InfoSoc-Richtlinie. Entscheidend war die Feststellung, dass die Liedtexte nicht nur analysiert, sondern in den Parametern des Modells reproduzierbar festgelegt wurden. Auch wenn die Texte nicht als zusammenhängender Datensatz vorlägen, sondern in verteilte mathematische Repräsentationen zerlegt seien, liege eine körperliche Festlegung vor. Diese Festlegung ermöglichte es, die Werke mittelbar – nämlich durch gezielte Prompts – wahrnehmbar zu machen.

Das Gericht verwies auf Studien der informationstechnischen Forschung, die belegen, dass Trainingsdaten in großen Sprachmodellen extrahierbar sind, insbesondere wenn sie mehrfach im Datensatz vorkommen:

Die streitgegenständlichen Texte sind nach Überzeugung der erkennenden Kammer gemäß § 286 Abs. 1 S. 1 ZPO im Modell enthalten (…) Aus der informationstechnischen Forschung ist bekannt, dass Trainingsdaten in Modellen enthalten sein können und sich als Outputs extrahieren lassen, was als Memorisierung bezeichnet wird (vgl. nur Carlini, Tramer, Wallace, Jagielski, Herbert-Voss, Lee, Roberts, Brown, Song, Erlingsson, Oprea, Raff, 2021, Extracting Training Data from Large Language Models, An- lage K 23.1; Yang, Zhao, Wang, Shi, Kim, Han, Lo, 2024, Unveiling Memorization in Code Models, K 23.8; Cooper, Grimmelmann, 2025, The Files are in the Computer, K 23.9).

Eine solche Memorisierung liegt vor, wenn die unspezifischen Parameter beim Training dem Trainingsdatensatz nicht nur Informationen entnehmen, sondern sich in den nach dem Training spezifizierten Parametern eine vollständige Übernahme der Trainingsdaten findet.

Die Wiedergabe der Texte bei einfachen Abfragen sei kein Zufall, sondern Beleg dafür, dass sie im Modell „memorisiert“ wurden. Selbst wenn die Outputs nicht immer wortidentisch seien, blieben die schöpferischen Elemente der Originalwerke erkennbar – und damit urheberrechtlich relevant.

Kein Schutz durch Text-und-Data-Mining-Schranken

Die Beklagten konnten sich nicht auf die Ausnahmebestimmungen des § 44b UrhG berufen. Zwar deckt diese Vorschrift Vervielfältigungen ab, die zur Vorbereitung von Text und Data Mining erforderlich sind – etwa die digitale Überführung von Werken in ein analysierbares Format. Die dauerhafte Speicherung der Werke im Modell selbst diene jedoch nicht der Datenanalyse, sondern ermöglichte deren spätere Wiedergabe. Damit überschreite sie den Zweck der Schranke, die lediglich vorübergehende, analysbezogene Vervielfältigungen gestattet:

Gemäß Art. 2 InfoSoc-RL liegt eine Vervielfältigung „auf jede Art und Weise und in jeder Form“ vor. Die Festlegung in bloßen Wahrscheinlichkeitswerten ist unerheblich (vgl. von Welser, GRUR 2024, 1406, 1411). Neue Technologien wie Modelle werden vom Vervielfältigungsrecht nach Art. 2 InfoSoc-RL und § 16 UrhG erfasst.

Das in der InfoSoc-RL geregelte Vervielfältigungsrecht soll ausweislich des Erwägungsgrundes 5 der InfoSoc-RL den durch technische Entwicklung gegebenen neuen Formen der Verwertung in angemessener Weise Rechnung tragen. Angesichts der damit im Urheberrecht für Verwertungsrechte geltenden Technologieneutralität (…) ist nicht entscheidend, welche Technik für die Verkörperung genutzt wird. Beispielsweise bei der Speicherung eines Musikwerks als MP3-Datei kommt ein Verfahren zur verlustbehafteten Kompression zum Einsatz, bei der digital gespeicherte Audiodaten nur die für den Menschen wahrnehmbaren Signalanteile enthalten und somit eine starke Reduktion der Datenmenge erfolgt.

Bekanntlich ist diese Komprimierung eine Vervielfältigung (…). Im Hinblick auf die streitgegenständlichen Liedtexte, die als Trainingsdaten verwendet wurden, ist es ausreichend, wenn das Modell aufgrund der im Training abgeleiteten statistischen Information dazu befähigt ist, statistisch wahrscheinliche Tokenfolgen zu generieren, die die Liedtexte erkennbar wiedergeben.

Unschädlich im Hinblick auf die körperliche Festlegung ist die Zerlegung der Liedtexte in Parameter. Die Parameter finden sich insgesamt im Modell. Eine derartige Festlegung kann mit progressiv gespeicherten JPEG-Dateien verglichen werden, bei denen Informationen in der Datei verstreut sind (…). Entgegen dem Vortrag der Beklagten ist es nicht erforderlich, einen konkret abgrenzbaren Datensatz im Modell zu identifizieren.

Unabhängig davon, ob dies tatsächlich möglich wäre, ist eine konkrete Abgrenzbarkeit kein Kriterium für die Annahme einer körperlichen Festlegung. Die Festlegung im Modell ist hinreichend, es handelt sich um einen mit hinreichender Genauigkeit und Objektivität identifizierbaren Gegenstand (…). Soweit für eine konkrete Abgrenzbarkeit für Vervielfältigungen im Modell auf die Rechtsprechung des Unionsgerichtshofs rekurriert wird, kann den in diesem Zusammenhang zitierten Entscheidungen (…) ein solches, das Vervielfältigungsrecht auf Tatbestandsebene verengendes Kriterium der Abgrenzbarkeit, nicht entnommen werden.

Auch der Einwand, die Memorisierung sei ein unbeabsichtigtes Nebenprodukt des Trainings, überzeugte das Gericht nicht. Selbst wenn die Beklagten die Wiedergabe von Trainingsdaten nicht beabsichtigt hätten, ändere dies nichts an der urheberrechtlichen Relevanz der Speicherung. Die Richter wiesen darauf hin, dass die Beklagten seit mindestens 2021 von der Möglichkeit der Memorisierung wussten, ohne wirksame Gegenmaßnahmen zu ergreifen. Die bloße Behauptung, ein „Unlearning“ bestimmter Inhalte sei technisch nicht möglich, entbinde nicht von der Pflicht, Lizenzen einzuholen oder auf geschützte Werke zu verzichten.

Haftung der Betreiber für KI-Outputs

Das Urteil macht deutlich, dass die Betreiber von Sprachmodellen für urheberrechtsverletzende Outputs verantwortlich sind, sofern diese auf memorisierten Inhalten beruhen.

Haftung

Die Beklagten üben dem Gericht zufolge die „Tatherrschaft“ aus, da sie die Trainingsdaten auswählen, die Modellarchitektur gestalten und die Rahmenbedingungen für die Generierung von Antworten setzen. Die Nutzer, die durch Prompts die Ausgabe anstoßen, seien hingegen nicht als Täter einzustufen – jedenfalls nicht bei einfachen, offenen Anfragen.

Interessant ist die Abgrenzung zu provozierten Outputs: Das Gericht räumte ein, dass Nutzer durch komplexe, gezielte Prompts („Jailbreaking“) möglicherweise selbst die Tatherrschaft übernehmen könnten. Im vorliegenden Fall waren die verwendeten Prompts jedoch so allgemein gehalten, dass die KI die Inhalte eigenständig und deterministisch reproduzierte. Die Beklagten könnten sich daher nicht auf eine bloße Bereitstellung neutraler Infrastruktur berufen, wie es etwa bei Hosting-Plattformen der Fall ist.

Öffentliche Zugänglichmachung und Vervielfältigung durch Outputs

Die Wiedergabe der Liedtexte durch den Chatbot qualifizierte das Gericht als öffentliche Zugänglichmachung nach § 19a UrhG. Entscheidend war, dass die Werke einem neuen Publikum – nämlich den Nutzern des KI-Dienstes – zugänglich gemacht wurden, ohne dass die Rechteinhaber hiermit rechnen mussten. Die Argumentation der Beklagten, es handele sich um eine unabhängige, maschinelle „Doppelschöpfung“, wies das Gericht zurück. Da die Outputs erkennbar auf den memorisierten Trainingsdaten beruhten, lag keine freie, kreative Neuschaffung vor, sondern eine derivativ-urheberrechtliche Nutzung.

Zudem sah das Gericht in den Outputs eine Vervielfältigung auf den Endgeräten der Nutzer sowie in der Chat-Historie der Cloud-Server. Diese Vervielfältigungen seien den Beklagten zuzurechnen, da sie die technischen und inhaltlichen Voraussetzungen hierfür schaffen.

Kein Freibrief durch öffentliche Zugänglichkeit im Internet

Die Beklagten hatten geltend gemacht, die Liedtexte seien ohnehin frei im Internet verfügbar gewesen, sodass eine stillschweigende Einwilligung der Rechteinhaber vorliege. Das Gericht folgte dieser Argumentation nicht. Die öffentliche Zugänglichkeit eines Werks rechtfertige nicht jede denkbare Nutzung – insbesondere nicht solche, die wie das KI-Training zum Zeitpunkt der Veröffentlichung bislang nicht absehbar waren. Zudem hätten die Rechteinhaber durch Nutzungsvorbehalte und technische Schutzmaßnahmen (wie robots.txt-Dateien) deutlich gemacht, dass sie eine Verwendung für KI-Zwecke nicht gestatten wollten.

Urteile zu KI & Urheberrecht 2025

In engem zeitlichen Kontext gab es auch eine Entscheidung des OLG Hamburg, die es einzuordnen gilt: Beide Entscheidungen befassen sich vordergründig mit der urheberrechtlichen Zulässigkeit der Nutzung geschützter Werke für das Training von KI-Systemen – doch sie beleuchten unterschiedliche Aspekte dieses komplexen Themenfelds. Während das Münchner Urteil die Memorisierung von Liedtexten in Sprachmodellen als unzulässige Vervielfältigung einstuft und Betreiber für die daraus resultierenden Outputs haftbar macht, bestätigt das Hamburger Urteil die Rechtmäßigkeit des Downloads einer Fotografie zur Erstellung eines KI-Trainingsdatensatzes unter Berufung auf die Schrankenregelungen der §§ 44b, 60d UrhG. Beide Gerichte setzen sich mit der Frage auseinander, wo die Grenzen zwischen zulässiger Datenanalyse und urheberrechtsverletzender Nutzung verlaufen – kommen jedoch aufgrund der unterschiedlichen Sachverhalte zu scheinbar gegensätzlichen Ergebnissen.

Tatsächlich widersprechen sich die Urteile nicht, sondern ergänzen sich: Das OLG Hamburg betont unter Rückgriff auf das LG München I, dass die vorbereitende Vervielfältigung von Werken für Text- und Data-Mining-Zwecke – hier der Abgleich von Bild und Textbeschreibung – unter den Voraussetzungen des § 44b UrhG zulässig ist, sofern keine wirksamen Nutzungsvorbehalte entgegenstehen. Das LG München hingegen stellt klar, dass die dauerhafte Speicherung von Werken im KI-Modell selbst (Memorisierung) über den bloßen Analysezweck hinausgeht und damit nicht mehr von der Schranke gedeckt ist. Beide Entscheidungen unterstreichen somit, dass der Gesetzgeber zwischen vorbereitenden, analysbezogenen Handlungen (Hamburg) und dauerhaften, verwertungsrelevanten Vervielfältigungen (München) differenziert. Die Urteile markieren damit eine wichtige und vor allem gemeinsame Weichenstellung für die künftige Auslegung des Urheberrechts im KI-Kontext – insbesondere die Frage, wann eine Nutzung noch als „Forschung“ gilt und wann sie in die kommerzielle Verwertung übergeht.

Rechtsanwalt Jens Ferner, TOP-Strafverteidiger und IT-Rechts-Experte - Fachanwalt für Strafrecht und Fachanwalt für IT-Recht

KI am Limit …

Das Urteil setzt erstmals spürbare und klare Grenzen für den Umgang mit urheberrechtlich geschützten Werken in KI-Systemen. Es bestätigt, dass das Urheberrecht technologieneutral anzuwenden ist und somit auch neue Verwertungsformen, wie das Training generativer Modelle, erfasst. Betreiber von KI-Systemen können sich nicht auf die Komplexität ihrer Technologie berufen, um eine Haftung zu umgehen. Vielmehr sind sie dafür verantwortlich, sicherzustellen, dass ihre Modelle keine geschützten Inhalte unrechtmäßig reproduzieren. Dies kann durch Lizenzierung, Filterung der Trainingsdaten oder technische Maßnahmen gegen Memorisierung erfolgen.

Eine Memorisierung ist urheberrechtlich relevant – jedenfalls im europäischen Rechtssystem. Sich dagegen zu wehren, ist absurd. Die Frage allein ist, in welchem dogmatischen Kontext der technische Effekt juristisch eingeordnet wird, dass man urheberrechtlich geschützte Werke vollständig verarbeitet, die dann aber nicht identisch speichert, wohl hingegen reproduziert werden können. Zu Recht ist im Übrigen darauf zu verweisen, dass die Glanzzeit des bisherigen Verständnisses von KI im Sinne von LLM sich dem Ende zuneigt – am Ende war das, was wir heute “KI” nennen, eher ein Marketing-Gag, um die bombastischen Ergebnisse zu vermarkten, die modernes Machine Learning, Big Data und Big Computing produzieren.

Die Entscheidung ist noch nicht rechtskräftig, da die Beklagten bereits Berufung angekündigt und wohl auch schon eingelegt haben. Unabhängig vom weiteren Verfahrensgang sendet das Urteil jedoch ein deutliches Signal: KI-Entwickler müssen urheberrechtliche Risiken ernst nehmen – oder sie müssen sich auf kostspielige Rechtsstreitigkeiten einstellen. Die Zeit, in der das „Crawlen“ des Internets als rechtlicher Graubereich galt, scheint vorbei zu sein. Die KI-Branche steht nun vor der Herausforderung, innovative Lösungen zu finden, die technologischen Fortschritt mit dem Schutz geistigen Eigentums in Einklang bringen.

Fachanwalt für Strafrecht & IT-Recht bei Anwaltskanzlei Ferner Alsdorf
Rechtsanwalt Jens Ferner ist ein renommierter Strafverteidiger im gesamten Strafrecht samt Managerhaftung (insbesondere bei Wirtschaftskriminalität wie Geldwäsche, Betrug, Untreue bis zu Cybercrime – aber auch im Jugendstrafrecht und Sexualstrafrecht) sowie Spezialist im IT-Recht (Softwarerecht und KI, IT-Vertragsrecht und Compliance). Als Fachanwalt für Strafrecht + IT-Recht verteidigt er Mandanten in anspruchsvollen Strafverfahren und berät in komplexen Softwareprojekten. Er ist Lehrbeauftragter für Wirtschaftsstrafrecht und IT-Compliance (FH Aachen) und publiziert fortlaufend.

Erreichbarkeit:Per Mail, Rückruf, Threema oder Whatsapp.

Unsere Anwaltskanzlei im Raum Aachen ist spezialisiert auf Strafverteidigung, Cybercrime, Wirtschaftsstrafrecht samt Steuerstrafrecht sowie IT-Recht.
Rechtsanwalt Jens Ferner
Rechtsanwalt Jens Ferner

Von Rechtsanwalt Jens Ferner

Rechtsanwalt Jens Ferner ist ein renommierter Strafverteidiger im gesamten Strafrecht samt Managerhaftung (insbesondere bei Wirtschaftskriminalität wie Geldwäsche, Betrug, Untreue bis zu Cybercrime – aber auch im Jugendstrafrecht und Sexualstrafrecht) sowie Spezialist im IT-Recht (Softwarerecht und KI, IT-Vertragsrecht und Compliance). Als Fachanwalt für Strafrecht + IT-Recht verteidigt er Mandanten in anspruchsvollen Strafverfahren und berät in komplexen Softwareprojekten. Er ist Lehrbeauftragter für Wirtschaftsstrafrecht und IT-Compliance (FH Aachen) und publiziert fortlaufend.

Erreichbarkeit:Per Mail, Rückruf, Threema oder Whatsapp.

Unsere Anwaltskanzlei im Raum Aachen ist spezialisiert auf Strafverteidigung, Cybercrime, Wirtschaftsstrafrecht samt Steuerstrafrecht sowie IT-Recht.