Door majortom: Er wordt een hash gemaakt die wordt vergeleken met een database van hashes die op kinderporno zouden duiden. Ik verander dus 1 pixel en wordt niet gedetecteerd.
De term "hash" in NeuralHash is (bewust?) verwarrend. Wat jij beschrijft is een cryptografische hash en daar heeft een NeuralHash (of PhotoDNA, maar ook een "hash" van biometrische data zoals een vingerafdruk-scan-"hash") niets mee te maken.
De overeenkomsten zijn dat het gaat om het "versnijden" van een bestand van willekeurige grootte dat een reeks bits oplevert van vaste lengte met een inhoud gerelateerd aan de inhoud van het bestand.
Belangrijke eisen aan een cryptografische hashfunctie zijn dat het wijzigen (of van volgorde veranderen) van één of meer bits in het bestand tot een (meestal totaal)
andere hashwaarde leidt, met als daaraan gerelateerde eis dat, gegeven bestand X, het (binnen afzienbare tijd) onmogelijk moet zijn om een
afwijkend bestand Y te vinden dat exact dezelfde cryptografische hashwaarde oplevert.
Bij NeuralHashes en PhotoDNA gaat het om fuzzy algoritmes waarbij naar specifieke karakteristieken in bitmaps wordt gekeken (en, denkbaar, bijv. 16 getallen van 16 bits achter elkaar worden geplakt voor een 256 bits "hash"). De "hashes" van twee bitmaps kun je vervolgens "van elkaar aftrekken" (het kan om andere rekenmethodes gaan) waarna het resultaat aangeeft hoeveel de twee bitmaps, "
voor het menselijk oog", van elkaar afwijken. Afhankelijk van de context kun je daar een grenswaarde voor verzinnen. Net als bij op Bluetooth gebaseerde Corona-Apps zal die grenswaarde een statistisch compromis zijn tussen twee kwaden: nog meer false positives of nog meer false negatives.
Behoudens een onbruikbare instelling met nul false positives (en gigantisch veel false negatives, minimaal gewijzigde beelden die niet meer worden herkend) is de kans op collisions sowieso extreem veel groter dan bij cryptografische hashes (omdat het, zeg maar, om meerdere achter elkaar geplakte identifiers gaat).
Sterker, getracht wordt om de algoritmes van NeuralHashes en PhotoDNA geheim te houden (bron: [1]) om te voorkomen dat ongewenst materiaal zo kan worden gemanipuleerd dat het (net als malware door AntiVirus producten) niet meer als zodanig wordt gedetecteerd. Zodra deze software naar Apple devices wordt verspreid, kun je "erop wachten" totdat deze wordt ge-reverse-engineered.
Het omgekeerde risico bestaat ook: hoe kun je als afperser bestanden op iemands device zodanig manipuleren dat deze als CSAM worden herkend (maar jij ze niet kunt vinden omdat ze van geen kanten op CSAM lijken). En feitelijk hoef je dat niet eens te kunnen als afperser: degenen die mij spammen dat zij mijn account(s) hebben gehacked en mij met mijn eigen smartphone hebben gefilmd terwijl ik masturberend naar porno zat te kijken (en dreigen die beelden naar mijn familie te sturen als ik niet betaal), liegen immers ook.
Maar zodra gijzelcybercriminelen
daadwerkelijk als CSAM gedetecteerd (al dan niet terecht) materiaal op jouw systemen (kunnen) plaatsen en meeversleutelen (of, om onmiddelijke detectie te voorkomen, op hun eigen systemen versleutelen met "jouw" sleutel, en dan op jouw opslag plaatsen), geeft dat een extra dimensie aan ransomware - ook als de encryptie niet zo sterk blijkt en/of je de decryptiesleutel op andere wijze in handen krijgt.
Last but not least: nog even los van de vraag of je het afschuwelijke probleem van kindermisbruik oplost door fotokijkers op te sporen (en wat dan): wie kijkt er nog naar foto's? Filmpjes zijn "in" (vermoedelijk geldt dat ook voor CSAM). Hoewel in [2] staat dat deze technologie ook voor video's zou werken, lijkt de door Apple aangekondigde software slechts naar foto's te "kijken". Welk probleem, anders dan toegeven aan de druk van naïeve overheden (voorbeeld: [3]) en pedojagers, lost Apple hier mee op?
[1] Uitgebreide en m.i. heldere uitleg van NeuralHashes en PhotoDNA, zie vanaf "Finding Similar Images" in
https://blog.cloudflare.com/the-csam-scanning-tool/[2]
https://en.wikipedia.org/wiki/Hany_Farid#PhotoDNA[3]
https://www.zdnet.com/article/canberra-asks-big-tech-to-introduce-detection-capabilities-in-encrypted-communication/