image

Privacytoezichthouders waarschuwen big tech voor risico’s online scraping

vrijdag 25 augustus 2023, 11:01 door Redactie, 10 reacties

Privacytoezichthouders uit allerlei landen en Amerikaanse staten waarschuwen grote techbedrijven in een openbare brief voor de risico’s van het scrapen van online data. Techreuzen hebben in veel landen een juridische plicht om online berichten van hun gebruikers te beschermen tegen scraping, schrijven de toezichthouders.

De gepubliceerde brief is ook rechtstreeks verstuurd aan Alphabet, ByteDance, Meta, Microsoft, Sina Corp en X (voorheen Twitter). In de brief schrijven de toezichthouders dat bedrijven die op grote schaal online data verzamelen (scrapen) zich vanzelfsprekend aan relevante wetgeving moeten houden, maar dat big tech ook een rol heeft in het voorkomen van third-party-scraping van hun websites. ‘Het massaal verzamelen van persoonlijke informatie kan in veel rechtsgebieden een te melden datalek vormen’, staat in de brief waar onder meer Techcrunch over schrijft.

Volgens de privacytoezichthouders brengt scraping verschillende privacyrisico’s met zich mee. Cybercriminelen kunnen er gerichte aanvallen als phishing en social engineering mee uitvoeren, commerciële bedrijven kunnen er hun databases voor bijvoorbeeld gezichtsherkenning mee uitbreiden en (buitenlandse) overheidsinstellingen kunnen de data gebruiken voor surveillancedoeleinden.

De privacytoezichthouders gaan in de brief niet specifiek in op het trainen van AI-modellen, wat ook gebeurt via scraping. In juni werd in de Verenigde Staten een class action lawsuit ingediend tegen OpenAI, het bedrijf achter het large language model (LLM) ChatGPT. OpenAI zou in het geheim grote hoeveelheden persoonlijke data van het internet halen om zijn LLM te trainen.

Sommige techreuzen zijn al beboet in scrapingzaken. Zo kreeg Meta eind vorig jaar een AVG-boete van 265 miljoen euro voor een datalek dat veroorzaakt is door scraping.

Reacties (10)
25-08-2023, 11:46 door Anoniem
Interessant.

Ik zie een toekomst voor self-hosted social media systemen.
Dat je een (goedkoop) kastje koopt en aan je router hangt, om daarmee dan vervolgens je eigen Whatsapp of Discord te hebben.
Dan heb je ongelimiteerde uploads, alle emojis en stickers die je maar wilt en een zekerheid dat je systeem blijft draaien als er ergens anders de servers uitvallen, crashen of gehackt worden.
25-08-2023, 12:50 door Anoniem
Door Anoniem: Interessant.

Ik zie een toekomst voor self-hosted social media systemen.
Dat je een (goedkoop) kastje koopt en aan je router hangt, om daarmee dan vervolgens je eigen Whatsapp of Discord te hebben.
Dan heb je ongelimiteerde uploads, alle emojis en stickers die je maar wilt en een zekerheid dat je systeem blijft draaien als er ergens anders de servers uitvallen, crashen of gehackt worden.

Technisch nu al mogelijk als je geen cloud only brand (Whatsapp/discord) neemt maar iets open source.

Maar ga je dan ook met jezelf praten? Er komt verder niemand anders op je social media systeem namelijk. Het is juist die hele algorithmic feed truc die mensen naar de content drijft. Geen "social" media is mogelijk zonder groote userbase en massaal data harvesten voor de content die je wil zien of makkelijk door de strot gedrukt kan worden.
25-08-2023, 15:18 door Anoniem
Door Anoniem: Geen "social" media is mogelijk zonder groote userbase en massaal data harvesten voor de content die je wil zien of makkelijk door de strot gedrukt kan worden.
https://en.wikipedia.org/wiki/Solid_(web_decentralization_project)
En voor als je uit de beschrijving niet meteen duidelijk wordt dat dit social media omvat, onderdeel ervan is: "An organized collection of standards and data formats/vocabularies providing the same capabilities that centralized social media services offer, such as identity, authentication, login, permission lists, contact management, messaging, feed subscriptions, comments, discussions, and others."

Zie verder ook:
https://en.wikipedia.org/wiki/Distributed_social_network
25-08-2023, 16:32 door Anoniem
Maar ga je dan ook met jezelf praten? Er komt verder niemand anders op je social media systeem namelijk. Het is juist die hele algorithmic feed truc die mensen naar de content drijft. Geen "social" media is mogelijk zonder groote userbase en massaal data harvesten voor de content die je wil zien of makkelijk door de strot gedrukt kan worden.

Nee hoor, als je een eigen server draait is verder nog het enige wat je nodig hebt een open protocol om met andere te communiceren. Met je eigen e-mail server kun je prima mailen met de rest van de wereld. (wel wat gedoe om je spam reputatie goed te houden). Maar ook met je eigen Matrix server kun je met miljoenen andere Matrix gebruikers op andere servers chatten, of Actitity pub voor sociale media in de Fediverse, met Mastodon voor microblogging, PixelFed voor plaatjes of PeerTube voor video. En het mooiste is nog dat al die verschillende fediverse programma's met elkaar kunnen praten.
25-08-2023, 17:23 door Anoniem

Nee hoor, als je een eigen server draait is verder nog het enige wat je nodig hebt een open protocol om met andere te communiceren. Met je eigen e-mail server kun je prima mailen met de rest van de wereld. (wel wat gedoe om je spam reputatie goed te houden). Maar ook met je eigen Matrix server kun je met miljoenen andere Matrix gebruikers op andere servers chatten, of Actitity pub voor sociale media in de Fediverse, met Mastodon voor microblogging, PixelFed voor plaatjes of PeerTube voor video. En het mooiste is nog dat al die verschillende fediverse programma's met elkaar kunnen praten.

Niet mijn punt, zoals ik zeg het is technisch al prima mogelijk. Je kan prima met mensen communiceren via je lokale social media kastjes.

Het fijt is alleen dat 99% van social media hypes, influencers, virals etc. zijn. Zie het success van tiktok.

Kijk naar TV, je kan prima je eigen talkshows en tv series produceren. Daar kijkt dan alleen je familie naar op een regen achtige zondag. De meeste mensen willen gewoon een brei voorgeschoteld krijgen en kunnen zappen.
25-08-2023, 19:02 door Anoniem
Grappig, via de sleepwet scraped de AIVD ook alles alvorens deze op een server op te slaan en door een algoritme uit te pluizen alvorens bepaalde content door mensen bekeken te worden. (PRISM, XKeyscore-axhtig, zullen ze wel een eigen naam hebben genoemd...
25-08-2023, 19:40 door Anoniem
Aan de ene kant willen we altijd iemand kunnen vinden. Aan de andere kant heb ik een bloedhekel aan mensen die menen dat als ze me gevonden hebben, ik 24/7 bereikbaar moet zijn. Soms bellen ze dan rustig nog drie keer.

Hoe je weer controle over je eigen prive leven krijgt is nog een ding. Als ze je vroeger op de vaste lijn belden dan was je gewoon niet thuis. Je kon niet eens weten of er iemand had gebeld.

Dat was nog vrij leven.
26-08-2023, 09:45 door Anoniem
Het vervelende voor ons als gewone burger is dat onze persoonsdata soms eindigt op sites zoals Hunter, Rocket Reach, Finder.

Poosje geleden kreeg ik van een van dat soort dataverzamelaars een best vage mail in de spambox over dat ze informatie over mij publiceren. Dat dat opt-out is (nergens natuurlijk duidelijk hoe je jezelf eruit haalt)

Privacywaakhonden zouden daar ook best hun pijlen eens op mogen richten: geen expliciete goedkeuring = geen toestemming om mijn emailadres en telefoonnummer te tonen aan wie dan ook.
En de marketeers die deze data gebruiken dito.

Dat zou pas vele telefoontjes en mailtjes schelen.
26-08-2023, 09:47 door karma4 - Bijgewerkt: 26-08-2023, 09:48
Waarvoor de privacy toezichthouders zelf een compleet sleepnet inrichten. Concurrentie van Big Brother door Big Tech
Intussen is de schade voor de burger wegens het faciliteren van misdaad en fraude.
26-08-2023, 14:07 door Anoniem
Privacywaakhonden zouden daar ook best hun pijlen eens op mogen richten: geen expliciete goedkeuring = geen toestemming om mijn emailadres en telefoonnummer te tonen aan wie dan ook.
Inderdaad en het moet nog veel verder gaan geen data van mensen die geen toestemming hebben gegeven
en daarmee bedoel ik geen schuifje wat aan staat en je zelf moet uitzetten.

Mensen moeten echt goed worden voorgelicht en dan in Jip en Janneketaal zodat ze echt gaan begrijpen wat
er met hun data gebeurd en die dan ja aangeeft moet voor de rest van zijn leven zijn mond houden. Die privacy-
waakhonden of hoe je ze noemen wil zijn er eigenlijk alleen in het in voordeel van die techbedrijven met hun
datagraaiers, zij horen echt op te komen voor burgers, maar ja dat zal wel niet interessant genoeg zijn.
Reageren

Deze posting is gelocked. Reageren is niet meer mogelijk.