Door Anoniem: Waarom wordt er in vredesnaam echte tapes gebruikt bij een oefening. Onnodig risico in mijn ogen door volle tapes te gebruiken i.p.v.. lege tapes zonder persoonsgegevens.
Je hebt niets aan lege tapes als je wilt testen hoe lang het duurt om de gegevens terug te zetten op de recovery site. Maar doe dat dan met valse informatie.
Als wij een acceptatie omgeving inrichten wordt die identiek aan de beoogde productie omgeving, inclusief hoeveelheid gegevens. Die gegevens zijn gegenereerd uit de gegevens op de productie omgeving, maar worden gerandomiseerd. Dat is trouwens wat anders dan geanonimiseerd. Dat vergde in het begin veel verduidelijking.
Bij randomisering wordt bij het kopieren per veld een random waarde ingevuld op basis van de karakteristieken van een veld. Bij geboortedatum wordt dus een echte datum ingevuld die ook nog moet voldoen aan extra eisen. Geboortedatum van een medewerker moet dus liggen tussen de datum van de oudst mogelijke en jongst mogelijke medewerkers. In een aantal applicaties is de randomisering zelfs aangepast om voor een dergelijke datum een verdeling over die periode te krijgen die overeenkomst met de echte verdeling. Zodat ook leeftijdgebaseerde acceptatietesten uitgevoerd kunnen worden.
Natuurlijk is het lastig om iets dergelijks op te zetten. Je hebt daar wel enig onderzoek van de echte gegevens van nodig. Daarnaast heb je mensen nodig die randomisering goed kunnen programmeren.
Bijkomend voordeel van randomisering per veld is dat je ook de onderlinge relaties totaal random hebt. Gelukkig zijn we nu wel af van testen of de partner van een medewerker wel het juiste geslacht heeft. :) Ook dat kan nu onderling random zijn.
Peter