Je hebt een klacht over de onderstaande posting:
Door Erik van Straten: Zou kunnen, maar marketeers en onderzoekers hebben veel meer geld over voor gepseudonimiseerde data. Dus graag een hash van het telefoonnummer (ze vertellen er niet bij dat je dit in een oogwenk kunt reversen, ongeacht de hashfunctie, en reversen is zelfs mogelijk indien -meegestuurde- salts zijn gebruikt). In het jaarverslag etc. schrijf je gewoon dat je geanonimiseerde gegevens hebt verkocht, Henk en Ingrid snappen het verschil toch niet. Dat met gepseudoninimiseerd werkt alleen met small data als je het door statische modellen wilt halen. Als je maar enkele gevallen hebt waaruit een signaal gehaald moet worden dan is het te snel groeperen een resultaat dat je maar een enkele observatie overhoudt. Denk eens aan zeldzame ziektes met een incidentie te meten in ppm (patients per million). De dagelijkse incidentie van corona wordt gemeten in gevallen per 100.000. De grotere aantallen kan je ook af met k-anonimity bijvoorbeeld in het opsplitsen in 4cijferig postcode gebied. Het gaat ...
Beschrijf je klacht (Optioneel):