Meta im Visier: Illegales Torrenting urheberrechtlich geschützter Bücher zur KI-Modellschulung?
Dieser Blogartikel wurde automatisch erstellt (und übersetzt). Er basiert auf dem folgenden Original, das ich für die Veröffentlichung auf diesem Blog ausgewählt habe:
“Torrenting from a corporate laptop doesn’t feel right”: Meta emails unsealed – Ars Technica.
Meta unter Verdacht: Urheberrechtsverletzungen durch KI-Training?
Jüngst veröffentlichte E-Mails von Meta scheinen das Unternehmen schwer zu belasten. Im Raum steht der Vorwurf, dass Meta illegal urheberrechtlich geschützte Bücher heruntergeladen hat, um damit seine KI-Modelle zu trainieren. Die Autoren, die Meta verklagt haben, sehen darin den bisher stärksten Beweis für ihre Anschuldigungen.
Das Ausmaß des Torrentings
Meta hatte bereits zugegeben, eine umstrittene Datensammlung namens LibGen heruntergeladen zu haben, die Millionen von Raubkopien enthält. Nun enthüllen ungeschwärzte E-Mails Details: Meta soll mindestens 81,7 Terabyte Daten aus verschiedenen Schattenbibliotheken über Anna's Archive heruntergeladen haben, darunter 35,7 Terabyte von Z-Library und LibGen. Zuvor sollen bereits 80,6 Terabyte von LibGen heruntergeladen worden sein. Die Kläger bezeichnen das Ausmaß als "erstaunlich".
Interne Bedenken und Warnungen
Besonders brisant: Interne E-Mails zeigen, dass Mitarbeiter Bedenken hinsichtlich der Legalität des Torrentings äußerten. Ein Meta-Forscher schrieb im April 2023: "Torrenting von einem Firmenlaptop fühlt sich nicht richtig an." Später konsultierte er das Rechtsteam und wies darauf hin, dass das "Seeding" der Dateien rechtlich problematisch sein könnte. Trotz dieser Warnungen soll Meta das Torrenting fortgesetzt und versucht haben, es zu verschleiern.
Der Vorwurf der Verschleierung
Es wird behauptet, Meta habe versucht, das Seeding zu verbergen, indem die Datensätze nicht über Facebook-Server heruntergeladen wurden, um eine Rückverfolgung zu vermeiden. Ein Mitarbeiter beschrieb die Vorgehensweise als "Stealth-Modus". Es wird auch behauptet, dass Einstellungen angepasst wurden, um das Seeding so gering wie möglich zu halten.
Konsequenzen und Ausblick
Die Autoren fordern nun, dass die an den Entscheidungen beteiligten Meta-Mitarbeiter erneut befragt werden, da die neuen Fakten früheren Aussagen widersprechen sollen. So soll Mark Zuckerberg beispielsweise angegeben haben, keine Kenntnis von der Nutzung von LibGen zu haben, während interne Nachrichten auf eine Eskalation der Entscheidung zu ihm hindeuten.
Meta selbst hat sich noch nicht zu den Vorwürfen geäußert, argumentiert aber weiterhin, dass das KI-Training mit LibGen "Fair Use" sei. Es bleibt abzuwarten, wie sich der Fall entwickelt und welche Konsequenzen die neuen Enthüllungen für Meta haben werden. Die Frage, ob und in welchem Umfang die Nutzung urheberrechtlich geschützten Materials zum Training von KI-Modellen zulässig ist, bleibt ein zentraler Streitpunkt.