Computerbeveiliging - Hoe je bad guys buiten de deur houdt

Datamining politiedatabank toont ‘onbehaaglijke verbanden’

07-12-2009, 13:13 door Syzygy, 9 reacties
Dit soort berichtgeving baart mij altijd zorgen !

http://weblogs.nrc.nl/media/2009/12/07/datamining-politiedatabank-toont-onbehaaglijke-verbanden/


Datamining politiedatabank toont ‘onbehaaglijke verbanden’
Uit het proefschrift van Tim Cocx, een onderzoeker aan de Universiteit Leiden, blijkt dat datamining in de database van één miljoen veroordeelde of verdachte Nederlanders talloze “significante en onbehaaglijke verbanden” oplevert. Dat schrijft Webwereld.

Informaticus Cocx vond de volgende correlaties:

* De vrouwen in de database zijn significant vaker verslaafd aan drugs dan mannen.

* Mensen verdacht van doodslag zijn relatief vaak al veroordeeld wegens racisme.

* Joyriders nemen het ook niet zo nauw met de arbeidswetten en alcohol.

* Diefstal met geweld hangt vaak samen met wapenbezit.

* Afrikaanse afkomst en veroordeeld voor overtredingen inzake ‘openbare veiligheid’.

* Criminelen op het platteland begaan ook vaak verkeersmisdrijven.


De vakgroep van Cocx werkt nauw samen met de politie, maar de politie mag volgens de onderzoeker niets doen met de uitkomsten van het promotieonderzoek. De resultaten zouden wel aanleiding tot actie kunnen zijn, zegt de informaticus in Webwereld: “Ik kan me voorstellen dat in sommige situaties er alarmbelletjes gaan rinkelen bij de politie. Je kunt er ook beleid op gaan baseren.” Toch raadt Cocx de politie aan voorzichtig te zijn omdat niet alle gegevens in de database correct zijn: “In marketing is een succespercentage van 85 procent hoog en met succes toe te passen in campagnes. Maar voor opsporing is een foutenpercentage van 15 procent tegenover mensen die je onterecht verdenkt niet aanvaardbaar.”




De Politie legt maar al te graag (verkeerde) correlaties.
Hiervan zien we vaak voorbeelden in programma's als Peter R. De Vries en de programma's als Wegmisbruikers.


De vakgroep van Cocx werkt nauw samen met de politie, maar de politie mag volgens de onderzoeker niets doen met de uitkomsten van het promotieonderzoek. De resultaten zouden wel aanleiding tot actie kunnen zijn, zegt de informaticus in Webwereld: “Ik kan me voorstellen dat in sommige situaties er alarmbelletjes gaan rinkelen bij de politie. Je kunt er ook beleid op gaan baseren.” Toch raadt Cocx de politie aan voorzichtig te zijn omdat niet alle gegevens in de database correct zijn:

De laatste zin hebben ze bij de Politie natuurlijk al lang niet meer gehoord want in hun gedachten natuurlijk al bezig met het "bestikkeren" van mogelijke verdachten.

Ik stel jullie dit stuk voor ter discussie en wil hiermee aangeven dat deze informatie en deze technieken LEVENSGEVAARLIJK zijn in de handen van de op dit vakgebied toch vaak MINDER GEINFORMEERDE POLITIEAGENTEN
(om het maar subtiel te zeggen)
Reacties (9)
07-12-2009, 14:08 door Anoniem
Vandaar dat een vingerafdruk database zo gevaarlijk is. Er is altijd wel een hit met iemand, desnoods een false hit, beetje correleren en je bent verdachte. En je bent niet zomaar verdachte af.
07-12-2009, 14:16 door Anoniem
Alle techniek kan levensgevaarlijk zijn in de handen van mensen die niet weten wat ze er mee moeten...

Aan de ene kant hoor je iedereen gillen dat de overheid meer moet doen aan mensen die kinderporno maken/verkrachten/met alcohol rijden, etc en aan de andere kant beklaagt iedereen zich over het feit dat de overheid zich overal mee bemoeit.

Vorige week maakte Google bekend een publieke DNS dienst te gaan aanstellen. Bij tweakers.net waren ze enthousiast. Zou de overheid eens moeten doen: "laat ons je e-mail maar afhandelen, je zoekresultaten bepalen en meekijken waar je naar toe surft".

De digitale maatschappij is overduidelijk op zoek naar z'n eigen wetten en regels
07-12-2009, 14:39 door Anoniem
Door Syzygy:

De Politie legt maar al te graag (verkeerde) correlaties.
Hiervan zien we vaak voorbeelden in programma's als Peter R. De Vries en de programma's als Wegmisbruikers.

Correlatie wijst uit dat de politie tijdens live uitzending van Peter vaak te hard rijdt... Conclusies:

1. Peter R de Vries dwingt de Politie hard te rijden
2. Bij het zien van de cameraploeg van Peter R de Vries ontstaat bij agenten de dwingende behoefte hard te gaan rijden
3. Peter R. de Vries rijdt te hard...anders kan hij nooit de agenten bijhouden die te hard rijden
4. Door hard te rijden als politie kom je op TV
5. SBS gaat een nieuw programma opstarten "Peter R de Vries zoekt Hardrijdende Politie"
6. Peter R de Vries gaat de presentatie doen van "Hard rijden with the Stars.."

Flauw natuurlijk, maar correlatie zoeken kun je niet grenzeloos blijven doen; anders wordt het een onderzoek in de stijl van "1 op de 6 mensen heeft 5 anderen om zich heen" (Harry Jekkers conference). Resultaten worden dan gezocht in plaats van vastgesteld.
07-12-2009, 14:52 door Anoniem
Als we niet oppassen zit iedereen met een blackbox in de auto, alle data van de kilometerbeprijzing gaat ook gebruikt worden voor data-mining.

Denk aan (voorbeeld) :
Binnen 1 uur heen&weer uit Belgie -> u bent illegaal vuurwerk verdachte, inval woonhuis is legitiem.
Ongeacht wat ze vinden ...
07-12-2009, 17:54 door Syzygy
Bedankt voor jullie bijdrage, ook de leuke maar we zijn het wel eens dat dit weer aanleiding gaat geven tot False Positives (om maar even in het jargon te blijven)
09-12-2009, 12:31 door spatieman
volgende item in die database.
internetters zijn vaak hackers..
09-12-2009, 13:07 door Anoniem
Sorry hoor, maar ik zie de problemen niet zo.

Bij de stelling "De vrouwen in de database zijn significant vaker verslaafd aan drugs dan mannen." geeft dit volgens mij alleen maar aan dat vrouwen niet vaak voor andere delicten met de politie in aanraking komen. M.a.w. omdat deze vrouwen verslaaft zijn, staan ze in de database. Het probleem in deze is de interpretatie. Mannen staan ook voor veel andere delicten in de database, geen wonder dat als je prectentages gaat vergelijken dat vrouwen dan hoger scroren in de relatie met drugs.
Een opendeur lijkt me. Geen politieagent gaat hiermee aan de slag. De veronderstelling dat dat wel zo is is ook een correlatie te ver.

Doet me denken aan de kop die ooit boven een artikel in de krant stond:
"Vrouwen die hun eigen naam blijven gebruiken verdienen over het algemeen meer dan vrouwen die de naam van hun partner aannemen.
Ook hier wordt menigeen op het verkeerde been gezet. De titel veronderstelt een raltie tussen eigenaam en inkomen. Die is er niet.
Punt is dat vrouwen die een hogere opleiding hebben, eerder kiezen voor een carrière en dan vanuit carrière oogpunt kiezen voor het dragen van hun eigennaam. Dit soort vrouwen verdient nu eenmaal meer dan de lager opgeleiden.
Simpelweg betekent dit dat er geen relatie is tussen eigennaam en inkomen, maar wel tussen opleiding en carrière.

Uit het artikel van van webwereld stijgt een lucht op van stemmingmakerij.
""Datamining politiedatabank toont ‘onbehaaglijke verbanden"". Voor wie is dit nu eigenlijk onbehagelijk?
Relaties zijn er of zijn er niet, maar het trekken van conclusies door de webwereld-lezers wordt hier door de titel wel heel erg een bepaalde kant opgestuurd.
09-12-2009, 13:14 door Syzygy
Door spatieman: volgende item in die database.
internetters zijn vaak hackers..

en

mensen zijn verdacht
04-01-2010, 14:16 door Anoniem
Wat een open deuren. Zo geldt ook: Zaterdag en zondag vallen meestal in het weekend (nee echt!)
Zulke verbanden vind ik dagelijks in mijn werk.
Met datamining kun je overigens leukere verbanden vinden, met meer combinaties. Met traditionele statistiek kun je ook zulke verbanden vinden en als ze nieuw en interessant zijn dan kan er beleid op gemaakt worden. Maar inderdaad: kennis van data is wel nodig zoals Anoniem hierboven zegt!
Reageren

Deze posting is gelocked. Reageren is niet meer mogelijk.