Actie banner

Waarom Meta pornofilms gebruikt om AI te trainen

Deel dit artikel

,

Meta

Meta, het moederbedrijf van Facebook, Instagram en WhatsApp, ligt opnieuw onder vuur. Dit keer draait het niet om privacy of misleidende advertenties, maar om iets onverwachts: de training van AI-modellen met behulp van duizenden pornofilms.

De aanklacht

Het productiebedrijf Strike 3 Holdings stelt dat Meta sinds 2018 zo’n 2.400 van hun films via BitTorrent illegaal heeft gedownload. Deze films zouden niet bedoeld zijn voor “intern gebruik”, maar om AI mee te trainen. Ook wordt Meta ervan beschuldigd de video’s als ruilmiddel te hebben gebruikt om toegang te krijgen tot andere datasets.

Strike 3 noemt zichzelf een producent van “feministische en ethische” porno en eist een schadevergoeding van 350 miljoen dollar. Meta ontkent de aantijgingen.

Waarom juist dit materiaal?

Het klinkt misschien vreemd dat AI zou leren van pornografische content, maar technisch gezien is het minder verrassend dan je denkt. Deze films bevatten namelijk lange, ononderbroken scènes, meerdere camerahoeken en veel interactie tussen mensen. Dat levert een schat aan visuele data op waar AI-modellen mee kunnen oefenen.

Voor een AI die moet begrijpen hoe mensen bewegen, communiceren en interacteren, zijn dit soort beelden bijzonder bruikbaar. De datasets worden anoniem verwerkt – niet om de inhoud, maar om de structuren van beeld, beweging en interactie.

Niet de eerste keer

Meta heeft vaker rechtszaken gehad rond het gebruik van datasets voor AI-training. In eerdere gevallen wist het bedrijf juridische claims te weerstaan, vaak op technische of procedurele gronden. Dit nieuwe conflict kan echter lastiger blijken, omdat het gaat om auteursrechten op omvangrijke en herkenbare content.

Wat betekent dit voor ons?

Voor HCC-leden is dit een duidelijk voorbeeld van de schaduwzijde van AI-ontwikkeling: bedrijven gebruiken enorme hoeveelheden data, vaak zonder dat precies duidelijk is waar die vandaan komen en of er toestemming is. Het gaat daarbij niet alleen om teksten en afbeeldingen, maar ook om video’s – en dus soms om controversieel materiaal.

Tips voor HCC-leden

  1. Wees bewust van datasets
    AI leert van wat erin wordt gestopt. Vraag je bij elk model af: waar komt de data vandaan?
  2. Check de licenties
    Gebruik je zelf AI-tools of train je een model? Zorg dat je datasets legaal en open source zijn.
  3. Denk aan bias
    Ongefilterde data (of ze nu uit sociale media of video’s komen) kunnen vooroordelen en vertekeningen versterken.
  4. Bescherm je eigen werk
    Deel je zelf content online? Bedenk dat het mogelijk wordt gebruikt in AI-training. Overweeg watermerken of licentievoorwaarden.
  5. Volg de juridische ontwikkelingen
    Rechtszaken zoals deze bepalen hoe bedrijven in de toekomst met data en auteursrechten moeten omgaan.

Conclusie

Of de rechter Meta schuldig acht of niet, dit voorval benadrukt hoe groot de honger naar data in de AI-industrie is. Alles wat digitaal beschikbaar is, kan in theorie worden gebruikt om AI slimmer te maken. Voor ons als gebruikers en ontwikkelaars is dit een wake-upcall: data zijn nooit neutraal, en transparantie over herkomst is cruciaal.

 

'Meld je aan voor de nieuwsbrief' van HCC!artificieleintelligentie

'Abonneer je nu op de nieuwsbrief en blijf op de hoogte van onze activiteiten!'

Aanmelden