Meta, het moederbedrijf van Facebook, Instagram en WhatsApp, ligt opnieuw onder vuur. Dit keer draait het niet om privacy of misleidende advertenties, maar om iets onverwachts: de training van AI-modellen met behulp van duizenden pornofilms.
De aanklacht
Het productiebedrijf Strike 3 Holdings stelt dat Meta sinds 2018 zo’n 2.400 van hun films via BitTorrent illegaal heeft gedownload. Deze films zouden niet bedoeld zijn voor “intern gebruik”, maar om AI mee te trainen. Ook wordt Meta ervan beschuldigd de video’s als ruilmiddel te hebben gebruikt om toegang te krijgen tot andere datasets.
Strike 3 noemt zichzelf een producent van “feministische en ethische” porno en eist een schadevergoeding van 350 miljoen dollar. Meta ontkent de aantijgingen.
Waarom juist dit materiaal?
Het klinkt misschien vreemd dat AI zou leren van pornografische content, maar technisch gezien is het minder verrassend dan je denkt. Deze films bevatten namelijk lange, ononderbroken scènes, meerdere camerahoeken en veel interactie tussen mensen. Dat levert een schat aan visuele data op waar AI-modellen mee kunnen oefenen.
Voor een AI die moet begrijpen hoe mensen bewegen, communiceren en interacteren, zijn dit soort beelden bijzonder bruikbaar. De datasets worden anoniem verwerkt – niet om de inhoud, maar om de structuren van beeld, beweging en interactie.
Niet de eerste keer
Meta heeft vaker rechtszaken gehad rond het gebruik van datasets voor AI-training. In eerdere gevallen wist het bedrijf juridische claims te weerstaan, vaak op technische of procedurele gronden. Dit nieuwe conflict kan echter lastiger blijken, omdat het gaat om auteursrechten op omvangrijke en herkenbare content.
Wat betekent dit voor ons?
Voor HCC-leden is dit een duidelijk voorbeeld van de schaduwzijde van AI-ontwikkeling: bedrijven gebruiken enorme hoeveelheden data, vaak zonder dat precies duidelijk is waar die vandaan komen en of er toestemming is. Het gaat daarbij niet alleen om teksten en afbeeldingen, maar ook om video’s – en dus soms om controversieel materiaal.
Tips voor HCC-leden
- Wees bewust van datasets
AI leert van wat erin wordt gestopt. Vraag je bij elk model af: waar komt de data vandaan? - Check de licenties
Gebruik je zelf AI-tools of train je een model? Zorg dat je datasets legaal en open source zijn. - Denk aan bias
Ongefilterde data (of ze nu uit sociale media of video’s komen) kunnen vooroordelen en vertekeningen versterken. - Bescherm je eigen werk
Deel je zelf content online? Bedenk dat het mogelijk wordt gebruikt in AI-training. Overweeg watermerken of licentievoorwaarden. - Volg de juridische ontwikkelingen
Rechtszaken zoals deze bepalen hoe bedrijven in de toekomst met data en auteursrechten moeten omgaan.
Conclusie
Of de rechter Meta schuldig acht of niet, dit voorval benadrukt hoe groot de honger naar data in de AI-industrie is. Alles wat digitaal beschikbaar is, kan in theorie worden gebruikt om AI slimmer te maken. Voor ons als gebruikers en ontwikkelaars is dit een wake-upcall: data zijn nooit neutraal, en transparantie over herkomst is cruciaal.