Het anonimiseren van gegevens biedt geen garantie dat de privacy van gebruikers wordt gewaarborgd. Dat blijkt uit promotieonderzoek van Matthijs Koot. Op basis van persoonsgegevens uit de gemeentelijke basisadministratie onderzocht hij de identificeerbaarheid van Nederlandse burgers via (deel)combinaties van postcode, geslacht en geboortedatum. 67% van de onderzoekspopulatie bleek uniek identificeerbaar binnen Nederland op basis van de vier cijfers van de postcode in combinatie met geboortedatum.
Elk gegeven betreffende een geïdentificeerde of identificeerbare persoon is een persoonsgegeven, zo stelt de Nederlandse privacywet. Om een database met persoonsgegevens te anonimiseren kan de informatie worden ontdaan van burgerservicenummers en persoonsnamen. Er is dan geen sprake meer van `geidentificeerde' personen, maar de vraag is wanneer ook niet langer sprake is van `identificeerbare' personen.
De-anonimiseren
Uit de resultaten van de onderzoeker blijkt dat het mogelijk is geanonimiseerde gegevens te de-anonimiseren. Hiertoe zijn slechts enkele gegevens nodig, zoals postcode, geboortedatum en geslacht, maar ook andere combinaties kunnen tot re-identificatie leiden.
Koots analyses zijn gebaseerd op het bepalen van de groottes van 'anonimiteitsgroepen': de hoeveelheid mensen die identificeerbaar is op basis van dezelfde combinatie van gegevens. Hoe kleiner zo'n groep, hoe beter identificeerbaar de mensen in die groep zijn.
Privacyrekenmachine
Ter ondersteuning van verdere analyses ontwikkelde en valideerde de onderzoeker enkele nieuwe technieken die gebaseerd zijn op kansrekening. De technieken bieden nieuwe mogelijkheden om de mate van privacy te kwantificeren, met als uiteindelijke doel privacy beter te kunnen waarborgen. Zo zou hiermee een privacyrekenmachine kunnen worden gebouwd waarmee in de toekomst bedrijven of zelfs individuen het effect van het toevoegen of ontsluiten van informatie op hun identificeerbaarheid kunnen berekenen.
Deze posting is gelocked. Reageren is niet meer mogelijk.