Door Aha: Zou er waarheid zitten in de mogelijkheid dat hoe meer metadata je verzameld hoe 'bewolkter' het beeld wordt dat je van iemand denkt te hebben?
Behalve de ruis in de data die MathFox noemt kan je je ook afvragen of de interpretatie van op zich correcte data altijd even goed is. Dat men je locatie uit een variabel IP-adres denkt te kunnen afleiden geeft al aan dat daar een aanname in verwerkt is die wel vaak, maar niet altijd klopt. Men gaat kennelijk niet voor absolutie precisie maar voor een precisie die ze voldoende vinden voor hun doelen (waaronder het gericht tonen van advertenties). De ruis zit daarmee niet alleen in de data zelf maar ook in de interpretatie ervan.
En je hebt het niet over metadata maar over data. In de informatica is metadata
data over data, data die data
beschrijft. Een informatiesysteem is een systeem dat voorziet in een informatiebehoefte, en de term metadata slaat niet op de informatie waar iemand behoefte aan heeft maar op de beschrijving van de opbouw van die informatie. Een database-schema (definitie van tabellen en velden) is metadata. De beschrijving van een berichttype is metadata, maar de inhoud van een concreet bericht van dat type is 'gewone' data. Je 06-nummer is onderdeel van de informatiebehoefte van Google, het beschrijft geen telefoonnummer maar
is een telefoonnummer, en daarmee geen metadata maar gewoon data.
In discussies en berichtgeving over bevoegdheden van opsporings- en inlichtingendiensten worden telefoonnummers, e-mailadressen en dergelijke metadata genoemd omdat het niet de uitgewisselde berichten betreft (gesprek, e-mail-body) maar informatie over die berichten: tussen welke partijen ze zijn uitgewisseld. Vanuit een informaticaperspectief vind ik dat oneigenlijk gebruik van de term. De adresgegevens zijn namelijk, of ze de inhoud van de berichten zelf nu wel of niet te zien krijgen, onderdeel van de informatiebehoefte van die diensten en daarmee geen metadata maar data.