image

Niet anoniem met geanonimiseerde gegevens

vrijdag 22 juni 2012, 09:21 door Redactie, 1 reacties

Het anonimiseren van gegevens biedt geen garantie dat de privacy van gebruikers wordt gewaarborgd. Dat blijkt uit promotieonderzoek van Matthijs Koot. Op basis van persoonsgegevens uit de gemeentelijke basisadministratie onderzocht hij de identificeerbaarheid van Nederlandse burgers via (deel)combinaties van postcode, geslacht en geboortedatum. 67% van de onderzoekspopulatie bleek uniek identificeerbaar binnen Nederland op basis van de vier cijfers van de postcode in combinatie met geboortedatum.

Elk gegeven betreffende een geïdentificeerde of identificeerbare persoon is een persoonsgegeven, zo stelt de Nederlandse privacywet. Om een database met persoonsgegevens te anonimiseren kan de informatie worden ontdaan van burgerservicenummers en persoonsnamen. Er is dan geen sprake meer van `geidentificeerde' personen, maar de vraag is wanneer ook niet langer sprake is van `identificeerbare' personen.

De-anonimiseren
Uit de resultaten van de onderzoeker blijkt dat het mogelijk is geanonimiseerde gegevens te de-anonimiseren. Hiertoe zijn slechts enkele gegevens nodig, zoals postcode, geboortedatum en geslacht, maar ook andere combinaties kunnen tot re-identificatie leiden.

Koots analyses zijn gebaseerd op het bepalen van de groottes van 'anonimiteitsgroepen': de hoeveelheid mensen die identificeerbaar is op basis van dezelfde combinatie van gegevens. Hoe kleiner zo'n groep, hoe beter identificeerbaar de mensen in die groep zijn.

Privacyrekenmachine
Ter ondersteuning van verdere analyses ontwikkelde en valideerde de onderzoeker enkele nieuwe technieken die gebaseerd zijn op kansrekening. De technieken bieden nieuwe mogelijkheden om de mate van privacy te kwantificeren, met als uiteindelijke doel privacy beter te kunnen waarborgen. Zo zou hiermee een privacyrekenmachine kunnen worden gebouwd waarmee in de toekomst bedrijven of zelfs individuen het effect van het toevoegen of ontsluiten van informatie op hun identificeerbaarheid kunnen berekenen.

Reacties (1)
22-06-2012, 09:34 door Anoniem
Interessant, vooral die "privacyrekenmachine". Het is goed om te weten wat resultaten zullen zijn van pogingen om privacy te beschermen.

Daarnaast lijkt het me onwaarschijnlijk dat de andere resultaten (de-anonimiseringsmogelijkheden) nog niet beschikbaar zijn voor bedrijven als Google. Volgens mij drijft hun bedrijfsmodel op dit soort concepten.

Wel weer goed dat dit wetenschappelijk aangetoond wordt, omdat je dan kans hebt dat wetgevers gaan inzien waar de echte privacy-problemen liggen. Dan worden ze misschien aangespoord om goede wetgeving te creëren. En zeker met zo'n privacyrekenmachine kun je mogelijk in zo'n wet ook controleerbare criteria opnemen. Vooral als de berekeningsconcepten daarachter zich blijven ontwikkelen, lijkt dat veelbelovend...
Reageren

Deze posting is gelocked. Reageren is niet meer mogelijk.