image

Brein haalt Nederlandstalige dataset gebruikt voor trainen AI-modellen offline

dinsdag 13 augustus 2024, 14:18 door Redactie, 10 reacties

Stichting Brein heeft een Nederlandstalige dataset die gebruikt werd voor het trainen van AI-modellen offline gehaald. Volgens Brein ontdekte het na een tip dat de dataset bestond uit illegale kopieën van tienduizenden boeken, miljoenen regels uit nieuwsartikelen van websites en ondertitels van talloze films en tv-series uit illegale bron.

"Hoewel de dataset daarmee niet direct geschikt was voor consumenten om te lezen als e-book of nieuwswebsite, is dit niet toegestaan. Het kopiëren en dus ook het dataminen uit illegale bron is nooit toegestaan. Ook voor het dataminen van legale bronnen met een auteursrechtenvoorbehoud is toestemming van de auteursrechthebbenden vereist", zo laat de stichting in een persbericht weten.

Niet alleen is de dataset offline gehaald, de maker ervan heeft een verklaring ondertekend waarin hij belooft geen inbreuk meer te maken. Tevens heeft hij informatie gegeven over ontvangers van de dataset. Brein onderzoekt nu welke AI-modellen deze dataset hebben gebruikt en zegt de betrokken partijen te zullen aanspreken.

Reacties (10)
13-08-2024, 14:35 door Anoniem
Meta, Microsoft, X, Apple en dergelijke mogen lekker onbeperkt graaien in de eigendommen van de burger, de burger mag niet graaien.
13-08-2024, 14:37 door Anoniem
Grappig dat ze dan niet vermelden om welke dataset het ging... Burger mag het niet weten, het is hun geheimpje.
13-08-2024, 14:38 door Anoniem
13-08-2024, 15:08 door Anoniem
‘Niets uit deze uitgave mag worden verveelvoudigd’ Skibidy Toilet

Ik ga er nu vanuit dat deze post niet gebruikt mag worden voor AI training en dat brein mij gaat helpen als dit wel gebeurt ;-)
13-08-2024, 15:16 door Bitje-scheef
Ja chips en cola kunnen uit de kast. Wie zegt namelijk dat er auteursrechten worden getreden. Een encyclopedie heeft ook verwijzingen naar auteurs en bekende stukken tekst. Is dit dan ook auteursrechtenbreuk ?
13-08-2024, 16:44 door Anoniem
Het is natuurlijk niets als je niet verteld welke modellen hier dan gebruik van maken. Want welke model mag ik nu niet meer gebruiken? (hoewel een model natuurlijk niet de dataset bevat waarmee deze getraind is.)
13-08-2024, 18:17 door Anoniem
Een nieuwsartikel enkel gebaseerd op één persbericht zonder andere bronnen ter verificatie.

En bij wederhoor wordt er verdere verduidelijking geweigerd.

Wie zegt dat BREIN DAADWERKELIJK iets offline heeft gehaald?

Dit is pure fictieve PR praat. En iedere journalist trapt erin.
13-08-2024, 19:26 door Anoniem
Brein heeft niets offline gehaald. Enkel gedreigd met een rechtszaak en hoge kosten. Nu weet nog niemand of diegene de wet heeft overtreden.
14-08-2024, 08:05 door Bitje-scheef
Even de link gevolgd:

Citaat "De dataset is inmiddels offline gehaald. De maker van de dataset heeft een verklaring ondertekend waarin hij belooft geen inbreuk meer te maken en heeft informatie gegeven over wie de dataset heeft ontvangen. BREIN onderzoekt nu welke AI-modellen deze dataset hebben gebruikt en zal de betrokken partijen aanspreken.

Om te helpen voorkomen dat partijen auteursrechtelijk beschermd materiaal massaal scrapen uit legale bronnen, raadt BREIN aan dat rechthebbenden een voorbehoud maken in lijn met de Auteurswet (artikel 15o.1). Veel bij BREIN aangesloten rechthebbenden doen dit al."
14-08-2024, 09:06 door Anoniem
Door Anoniem: Meta, Microsoft, X, Apple en dergelijke mogen lekker onbeperkt graaien in de eigendommen van de burger, de burger mag niet graaien.
Dan verwijder je jezelf toch van deze diensten? Dan wordt de datamining ook geminimaliseerd.
Reageren
Ondersteunde bbcodes
Bold: [b]bold text[/b]
Italic: [i]italic text[/i]
Underline: [u]underlined text[/u]
Quote: [quote]quoted text[/quote]
URL: [url]https://www.security.nl[/url]
Config: [config]config text[/config]
Code: [code]code text[/code]

Je bent niet en reageert "Anoniem". Dit betekent dat Security.NL geen accountgegevens (e-mailadres en alias) opslaat voor deze reactie. Je reactie wordt niet direct geplaatst maar eerst gemodereerd. Als je nog geen account hebt kun je hier direct een account aanmaken. Wanneer je Anoniem reageert moet je altijd een captchacode opgeven.