image

Onderzoeker scrapet 1 miljoen Bluesky-posts voor 'machine learning onderzoek'

woensdag 27 november 2024, 15:36 door Redactie, 0 reacties

Een onderzoeker heeft één miljoen posts van socialmediaplatform Bluesky gescrapet en via internet aangeboden, om de dataset na kritiek weer te verwijderen. Bluesky kijkt naar een robot.txt-achtige aanpak waarmee gebruikers kunnen aangeven of hun posts voor 'AI-training' gebruikt mogen worden, maar het platform benadrukt dat het uiteindelijk aan externe partijen is om een dergelijke 'afspraak' te respecteren, wat inhoudt dat alle publieke posts voor dergelijke doeleinden zijn te gebruiken.

Daniel van Strien, een medewerker van Hugging Face, een bedrijf dat tools maakt waarmee het mogelijk is om machine learning binnen applicaties te gebruiken of die daarmee te ontwikkelen, verzamelde via een publieke API (application programming interface) één miljoen Bluesky-posts. Het ging om de inhoud van berichten, metadata en informatie over mediabijlagen en 'reply relationships'. Volgens Van Strien zou de dataset voor allerlei doeleinden zijn te gebruiken, waaronder het analyseren van 'social media posting patterns'.

De dataset werd vervolgens op internet aangeboden, maar Van Strien besloot die na kritiek 'voor nu' weer te verwijderen. Bluesky kwam daarna met het bericht dat het geen 'generatieve AI' met gebruikersdata traint. Voor externe partijen is dit echter anders. "Bluesky is een open en publiek sociaal netwerk, net zoals websites op het internet. Websites kunnen met een robots.txt-bestand aangeven of ze toestaan dat externe bedrijven hun data crawlen, en we kijken hier naar een soortgelijke oplossing." Het platform voegt toe dat het uiteindelijk aan externe partijen is om een dergelijke oplossing te respecteren, aangezien Bluesky naar eigen zeggen dit zelf niet kan afdwingen.

Nog geen reacties
Reageren
Ondersteunde bbcodes
Bold: [b]bold text[/b]
Italic: [i]italic text[/i]
Underline: [u]underlined text[/u]
Quote: [quote]quoted text[/quote]
URL: [url]https://www.security.nl[/url]
Config: [config]config text[/config]
Code: [code]code text[/code]

Je bent niet en reageert "Anoniem". Dit betekent dat Security.NL geen accountgegevens (e-mailadres en alias) opslaat voor deze reactie. Je reactie wordt niet direct geplaatst maar eerst gemodereerd. Als je nog geen account hebt kun je hier direct een account aanmaken. Wanneer je Anoniem reageert moet je altijd een captchacode opgeven.