Rik Groteboer 23 dec. 2024

Artificiële intelligentie (AI)-verordening: auteursrecht (deel 6) - Duitse rechter: maken van database ten behoeve van training AI-systemen géén auteursrechtinbreuk

Binnen onze AI-blogserie behandelen wij enkele aspecten van AI in samenhang met het auteursrecht. Een veel gestelde vraag is of het is toegestaan om auteursrechtelijk beschermde werken te gebruiken om (generatieve) AI-modellen mee te trainen. In deel 5 van onze blogserie zijn wij uitgebreid ingegaan op de zogeheten tekst- en datamining (TDM)-uitzondering uit de Auteurswet, en de vraag of deze het trainen van generatieve AI voor commerciële doeleinden zou kunnen faciliteren. U kunt deze blog hier vinden.

Op 27 september 2024 heeft een Duitse rechter – naar ons weten voor het eerst in Europa – uitspraak gedaan over de vraag hoe de TDM-uitzondering zich verhoudt tot het samenstellen van databases waarmee AI-modellen kunnen worden getraind. Hoewel er nog zeker veel vragen overblijven, is de verwachting dat deze uitspraak een belangrijk aanknopingspunt zal vormen in toekomstige geschillen m.b.t. het trainen van AI-modellen en het auteursrecht.

Feiten

De zaak is aangespannen door de Duitse stockfotograaf Robert Kneschke, nadat hij ontdekte dat één van zijn foto’s (of, zuiverder gezegd, een hyperlink naar één van zijn foto’s) voorkwam in de LAION 5B-database. LAION is een nonprofit-organisatie die databases creëert met onder andere hyperlinks naar afbeeldingen, specifiek ten behoeve van AI-ontwikkelaars om hun modellen mee te trainen. De LAION 5B-database bevat links naar meer dan 2,3 miljard afbeeldingen, en veel afbeeldingsgeneratoren die momenteel populair zijn, zoals Midjourney en Stable Diffusion, maken er gebruik van. LAION maakt deze databases door afbeeldingen over het hele internet te ‘scrapen’.

Kneschke stelt dat het ‘scrapen’  door LAION van zijn afbeelding een inbreuk vormt op zijn auteursrechten. De stockwebsite waarop Kneschke de foto had geüpload, had namelijk in haar algemene voorwaarden opgenomen dat de foto’s op deze website niet mochten worden gescraped. LAION stelt daartegenover dat van inbreuk geen sprake is. Uiteindelijk wordt LAION in het gelijk gesteld. Wat was er aan de hand? De uitspraak bevat een aantal interessante punten, ook vanuit het perspectief van de auteursrechthebbende, die wij hierna zullen bespreken.

Tekst- en datamining (TDM)

Allereerst: wat houdt TDM precies in? Hieronder de definitie zoals deze is opgenomen in artikel 25a lid 3 Auteurswet.

In deze paragraaf wordt onder tekst- en datamining verstaan een geautomatiseerde analysetechniek die gericht is op de ontleding van tekst en gegevens in digitale vorm om informatie te genereren zoals, maar niet uitsluitend, patronen, trends en onderlinge verbanden.

TDM ziet dus eigenlijk op automatische analyse van (vaak enorme hoeveelheden aan) data waaruit patronen en verbanden kunnen worden afgeleid c.q. gegenereerd, die tot nieuwe inhoud kan leiden. TDM kan bijvoorbeeld worden ingezet om het goedkoopste telefoonplan te vinden, om te voorspellen wat het weer gaat worden, om generatieve AI-systemen te faciliteren, et cetera.. Voor TDM is het eigenlijk altijd nodig om de ‘databron’ te verveelvoudigen, en als daar dan auteursrecht op rust (bijvoorbeeld bij een afbeelding) is dat in principe in strijd met de Auteurswet. Toch zijn in de wet bepaalde uitzonderingsgevallen opgenomen waarin het uitvoeren van TDM-activiteiten niet als een inbreuk op het auteursrecht moet worden beschouwd. Dat kan bijvoorbeeld indien TDM wordt uitgevoerd voor wetenschappelijke onderzoeksdoeleinden, of wanneer de auteursrechthebbende geen geldig voorbehoud voor TDM heeft gemaakt. Voor een uitgebreidere behandeling van TDM en de daarbij behorende uitzonderingen, verwijzen wij u graag naar onze eerdere blog.

De uitspraak

In de procedure stelde Kneschke ten eerste dat LAION geen beroep kon doen op een TDM-uitzondering, aangezien het enkele scrapen van afbeeldingen en deze in een database stoppen niet als TDM kon worden aangemerkt. De Duitse rechter oordeelde daarentegen dat deze handeling wel moet worden gezien als TDM, en deed dat aan de hand van de AI-verordening. Deze nieuwe wetgeving, specifiek gericht op kunstmatige intelligentie, stelt namelijk dat het creëren van datasets waarmee AI-modellen worden ontwikkeld onder het begrip ‘TDM’ valt.

Ten tweede oordeelde de rechter dat LAION zich op een TDM-uitzondering kon beroepen in het kader van wetenschappelijk onderzoek. De rechter kwam tot dit oordeel doordat LAION haar database zonder winstoogmerk openbaar aanbiedt. Daarnaast was het voldoende dat het creëren van een dergelijke database een fundamentele stap is voor wanneer deze wordt gebruikt om AI-modellen te trainen ten behoeve van wetenschappelijk onderzoek. Dat de uiteindelijke database ook door commerciële partijen kan worden gebruikt, is volgens de Duitse rechter irrelevant voor de vraag of het scrapen zelf is gedaan met wetenschappelijk onderzoek als doel. Deze redenering is erg interessant, juist omdat altijd werd verondersteld dat de drempel voor wetenschappelijk onderzoek niet snel wordt gehaald. 

Verder was doorslaggevend dat de TDM-uitzondering in het licht van wetenschappelijk onderzoek niet door een andersluidende bepaling in de algemene voorwaarden kan worden overschreden. Deze bepaling is namelijk van dwingend recht, wat betekent dat partijen daar niet van af kunnen wijken door andere afspraken te maken. Met andere woorden, het feit dat de stockfotosite in haar voorwaarden had opgenomen dat haar foto’s niet gescraped mochten worden, deert LAION in dit geval niet.

Maar wat als er geen wetenschappelijk doel is?

Wanneer TDM wordt uitgevoerd zonder dat daar wetenschappelijk onderzoek mee gemoeid is, wat dan? De Duitse rechter heeft ook hier geprobeerd duidelijkheid te verschaffen. In onze eerdere blog over TDM gaven wij al aan dat TDM voor commerciële doeleinden in principe is toegestaan, tenzij de auteursrechthebbende een voorbehoud heeft gemaakt. Dit voorbehoud moet volgens Europees recht worden gemaakt op een manier die machinaal leesbaar is. 

Wat daar onder moet worden verstaan, bestond tot voor kort nog onduidelijkheid over. In de onderhavige kwestie heeft de Duitse rechter een zeer coulante benadering gehanteerd voor de auteursrechthebbende: ook een voorbehoud in ‘gewone tekst’ in de algemene voorwaarden kan voldoen, als de bewoording voldoende begrijpelijk is voor technologische middelen op het moment dat TDM wordt toegepast. De redenering hierachter is dat bepaalde Large Language Models (zoals ChatGPT) nu dermate vergevorderd zijn dat zij uit de context kunnen afleiden c.q. ‘begrijpen’ dat een tekst moet worden gezien als een uitdrukkelijk voorbehoud. Als deze redenering stand houdt, zou voor auteursrechthebbenden de last met betrekking tot het aanbrengen van een machinaal leesbaar TDM-voorbehoud aanzienlijk verminderd worden. Daarentegen zullen ontwikkelaars die gebruikmaken van TDM verder onderzoek moeten doen om na te gaan of de auteursrechthebbende al dan niet  een voorbehoud heeft gemaakt.

Nog lang niet alle vragen opgelost

Waar de Duitse rechter een aantal vragen beantwoordt, roept deze uitspraak ook de nodige vragen op. Allereerst stelt de rechter, in het kader van generatieve AI-systemen, dat het hier echt alleen gaat om het gebruik van TDM om een dataset samen te stellen ten behoeve van het trainen van AI-systemen; niet op het daadwerkelijke trainen zelf! Hoe deze handeling zich verhoudt tot de regels over TDM zal nog moeten blijken.

Daarnaast is er door Kneschke hoger beroep ingesteld. Het is daarom de vraag of alle onderdelen van de uitspraak, met name die zien op het uitvoeren van wetenschappelijk onderzoek door LAION, en de machine-leesbaarheid van ‘gewone tekst’ in algemene voorwaarden om een geldig voorbehoud te kunnen maken, stand zullen blijven houden. Met name over deze twee punten is de laatste maanden veel te doen geweest. Ten slotte moet ook worden gezegd dat het hier gaat om de interpretatie van Europese regelgeving, en waar een Duitse rechter het ene oordeel velt, hoeft dat niet te betekenen dat bijv. een Nederlandse rechter hier op dezelfde manier naar zal kijken. Het is wat dat betreft wachten op een uitspraak van het Europese Hof.

Conclusie

Dit is de eerste uitspraak in Europa die gaat over de vraag hoe het trainen van AI-modellen met behulp van auteursrechtelijk beschermd materiaal moet worden beoordeeld. De Duitse rechter stelt dat bij het samenstellen van een database die onder meer kan worden gebruikt voor het trainen van AI-systemen, het eventuele kopiëren van auteursrechtelijk beschermd materiaal kan worden gerechtvaardigd in het kader van wetenschappelijk onderzoek. Daarnaast stelt hij ook dat wanneer dergelijke TDM-activiteiten juist worden verricht voor commerciële doeleinden, de auteursrechthebbende dit kan tegengaan door in de algemene voorwaarden van de website op te nemen dit niet te willen. Dit voorbehoud moet volgens de wet machine leesbaar zijn, en de rechter stelt dat – zeker wanneer het gaat om generatieve AI-systemen – ‘gewone’ tekst voor bepaalde machines al voldoende te begrijpen is. Of deze redenering blijft staan zal het hoger beroep moeten uitwijzen. In ieder geval is deze uitspraak een belangrijk juridisch aanknopingspunt binnen de zeer actuele strijd tussen auteursrechthebbenden en AI-ontwikkelaars, die ongetwijfeld nog een poos voort zal woeden. 

Elferink & Kortier Advocaten volgt deze rechtszaak – en overige ontwikkelingen omtrent AI en het intellectuele eigendomsrecht - op de voet en houdt u op de hoogte. Bij behoefte aan juridisch advies over het snijvlak van deze twee onderwerpen, en meer, kunt u altijd contact met ons opnemen.

Rik 1

Meer weten over dit onderwerp of een andere vraag?

Wij plaatsen functionele en analytische cookies. Eventueel kunnen derde partijen tracking cookies plaatsen. U dient daar dan eerst mee akkoord te gaan. Lees meer in onze Privacyverklaring