Nieuws

Onderzoeker scrapet 1 miljoen Bluesky-posts voor 'machine learning onderzoek'

woensdag 27 november 2024, 15:36 door Redactie, 0 reacties

Een onderzoeker heeft één miljoen posts van socialmediaplatform Bluesky gescrapet en via internet aangeboden, om de dataset na kritiek weer te verwijderen. Bluesky kijkt naar een robot.txt-achtige aanpak waarmee gebruikers kunnen aangeven of hun posts voor 'AI-training' gebruikt mogen worden, maar het platform benadrukt dat het uiteindelijk aan externe partijen is om een dergelijke 'afspraak' te respecteren, wat inhoudt dat alle publieke posts voor dergelijke doeleinden zijn te gebruiken.

Daniel van Strien, een medewerker van Hugging Face, een bedrijf dat tools maakt waarmee het mogelijk is om machine learning binnen applicaties te gebruiken of die daarmee te ontwikkelen, verzamelde via een publieke API (application programming interface) één miljoen Bluesky-posts. Het ging om de inhoud van berichten, metadata en informatie over mediabijlagen en 'reply relationships'. Volgens Van Strien zou de dataset voor allerlei doeleinden zijn te gebruiken, waaronder het analyseren van 'social media posting patterns'.

De dataset werd vervolgens op internet aangeboden, maar Van Strien besloot die na kritiek 'voor nu' weer te verwijderen. Bluesky kwam daarna met het bericht dat het geen 'generatieve AI' met gebruikersdata traint. Voor externe partijen is dit echter anders. "Bluesky is een open en publiek sociaal netwerk, net zoals websites op het internet. Websites kunnen met een robots.txt-bestand aangeven of ze toestaan dat externe bedrijven hun data crawlen, en we kijken hier naar een soortgelijke oplossing." Het platform voegt toe dat het uiteindelijk aan externe partijen is om een dergelijke oplossing te respecteren, aangezien Bluesky naar eigen zeggen dit zelf niet kan afdwingen.

Hema getroffen door ransomware-aanval op softwareleverancier Blue Yonder

ESET: eerste proof of concept UEFI-bootkit voor Linux-systemen ontdekt

Nog geen reacties

Reageren

Deze posting is gelocked. Reageren is niet meer mogelijk.

Ik vertrek na een grootschalig datalek:

Vacature

Information Security Manager IT/OT

Als Information Security Manager IT/OT zorg jij ervoor dat informatiebeveiliging binnen onze IT- en OT-omgevingen niet alleen op papier klopt, maar aantoonbaar werkt in de uitvoering. Je richt je op het veilig en betrouwbaar functioneren van operationele processen en draagt bij aan een volwassen, risicogestuurde be-veiliging van onze vitale infrastructuur.

Lees meer

Meldpunt Identiteitsfraude: datalek Odido zorgt voor ongerustheid bij klanten

09:50 door Redactie

Het datalek bij Odido zorgt voor ongerustheid bij klanten, zo laat het Centraal Meldpunt Identiteitsfraude (CMI) weten. Het ...

13 reacties

Lees meer

Vacature

Security Analist IT/OT

Als Security Analist IT/OT draag jij bij aan het verder professionaliseren van onze digitale weerbaarheid. Je bewaakt da-gelijks de veiligheid van onze IT- en OT-omgevingen en zorgt ervoor dat risico’s tijdig worden gesignaleerd en opgevolgd. Zo help je mee om vitale processen rondom water en onze kantoorauto-matisering betrouwbaar en veilig te laten functioneren.

Lees meer

Vacature

Security Architect IT/OT

Als Security Architect IT/OT geef jij richting aan de technische en architec-tonische inrichting van veilige IT- en OT-omgevingen. Je vertaalt bestaand beleid en wet- en regelgeving naar concrete, uitvoerbare ontwerpprincipes en bewaakt de samenhang tussen techniek, organi-satie en risico’s.

Lees meer

Meerdere banken staan bankieren op telefoons met gesideloade apps niet toe. Is dat wel legaal en botst dit niet met de DMA?

11-02-2026 door Arnoud Engelfriet

Juridische vraag: Verschillende banken, waaronder de Britse bank HSBC en de Deense bank Danske Bank, laten hun apps niet werken ...

31 reacties

Lees meer

Security.NL - X

10-01-2024 door Redactie

Altijd meteen op de hoogte van het laatste security nieuws? Volg ons ook op X!

Lees meer

Onderzoeker scrapet 1 miljoen Bluesky-posts voor 'machine learning onderzoek'

Ik vertrek na een grootschalig datalek:

Wachtwoord Vergeten

Password Reset

Registreren