Wetenschappers hebben een manier ontwikkeld waarmee het mogelijk is om anonieme programmeurs aan de hand van hun programmacode te identificeren, waarmee bijvoorbeeld cybercriminelen kunnen worden bestreden. De onderzoekers kijken hiervoor naar karakteristieke eigenschappen in de code.
"Net zoals schrijvers en artiesten heeft elke programmeur een eigen unieke stijl", zegt Aylin Caliskan-Islam, een promovendus aan de Universiteit van Drexel. Ze ontwikkelde het systeem en schreef er een technisch rapport over. "Ons proces verzamelt de belangrijkste karakteristieken van iemands programmeerstijl, wat de eerste stap is in het identificeren van anonieme auteurs, het vinden van cybercriminelen en het afwikkelen van vragen over intellectueel eigendom."
Caliskan-Islam stelt dat er al goede tools zijn die natuurlijke taal kunnen verwerken om anonieme auteurs aan hun schrijfstijl te identificeren. Aan de hand daarvan vroeg ze zich af of het mogelijk was een soortgelijk systeem voor programmeurs te ontwikkelen. De sleutel volgens de onderzoekster is het onderzoeken van meerdere facetten van de code, waar deze eigenschappen bij elkaar komen en een uniek patroon vormen dat alleen in de code van een specifieke programmeur wordt aangetroffen.
Voor haar onderzoek verzamelde Caliskan-Islam het werk van programmeurs die de afgelopen 6 jaar aan de "Google Code Jam-wedstrijden" meededen. Dit leverde uiteindelijk 20.000 verschillende programmeerkenmerken op. Het programma van de onderzoekster wist dit tot 137 kenmerken te beperken, die vervolgens konden worden gebruikt voor het maken van digitale vingerafdrukken van de programmeurs. Uiteindelijk werd deze verzameling afgezet tegen verschillende oplossingen die de programmeurs voor de Google-wedstrijden hadden geprogrammeerd.
Aan de hand hiervan wisten de onderzoekers de pogrammeurs met een 95% nauwkeurigheid aan hun programmeerstijl te identificeren. Volgens Caliskan-Islam kan haar oplossing helpen bij het vinden van cybercriminelen of forensisch onderzoek, maar ook het beslechten van discussies over wie de oorspronkelijke auteur van een stuk software is. De onderzoekers zijn nu bezig om de analysesoftware verder uit te breiden, zodat die straks code in elke programmeertaal kan herkennen.
Deze posting is gelocked. Reageren is niet meer mogelijk.