Privacy - Wat niemand over je mag weten

Wat is een 'record' bij datalekken

29-10-2019, 20:36 door FredSchrijver, 9 reacties
Bij berichten over datalekken zie je vaak dat de hoeveelheid gelekte persoonsgegevens wordt uitgedrukt in 'records' (zie voorbeeld via onderstaande link). Maar als je iets uitdrukt in een eenheid moet daar toch een duidelijke definitie van zijn. Wie heeft die voor me?

https://www.security.nl/posting/629259/Italiaanse+bank+UniCredit+meldt+datalek+van+3+miljoen+records

Fred
Reacties (9)
29-10-2019, 20:51 door [Account Verwijderd]
Door FredSchrijver: Bij berichten over datalekken zie je vaak dat de hoeveelheid gelekte persoonsgegevens wordt uitgedrukt in 'records' (zie voorbeeld via onderstaande link). Maar als je iets uitdrukt in een eenheid moet daar toch een duidelijke definitie van zijn. Wie heeft die voor me?

https://www.security.nl/posting/629259/Italiaanse+bank+UniCredit+meldt+datalek+van+3+miljoen+records

Fred

Dag Fred,

Heel summier gesteld: Een record is een verzameling gegevens van één persoon, object of gebeurtenis.
30-10-2019, 06:17 door karma4 - Bijgewerkt: 30-10-2019, 06:27
Een record bij risico management heeft een heel andere context en uitleg dan de technische ict wereld waar iemand de woorden van een database concept gebruikt.

Een record document object is een lost te herkennen deel zoal de velletjes papier of een DVD.
Het zegt nog niets over de inhoud of de gevoeligheid.

Voor de journalistiek en her nieuws moet het zo ernstig en omvangrijk mogelijk gebracht worden.
Er is een groot verschil in wie wat zegt.

Lees het verhaal. Er staat dat èèn bestand (file) buiten zicht geraakt is. Dat kan die DVD zijn bij bivoorbeeld marketing.
Het noemen van een enkel bestand zegt niet zo veel. Het kan de bijbel zijn. Voor de risico inschatting komen ze dat het over 3m records met genoemde gegevens gaat. Er staat niet klanten. In een genormaliseerd bestand zal een klant meerdere records hebben ( meerdere telefoons enails).
30-10-2019, 07:31 door [Account Verwijderd] - Bijgewerkt: 30-10-2019, 07:32
Record - a record represents a collection of attributes that describe a real-world entity. A record consists of fields, with each field describing an attribute of the entity. - http://www.umsl.edu/~joshik/msis480/chapt06.htm

Dus indien men over klantenrecords spreekt dan betreft een record - zoals Wilbert Wintergaard ook al stelt - een verzameling gegevens van één klant.

Wat karma4 op z'n gebruikelijke verwarde en irrelevante context erbij trekkende wijze probeert aan te duiden, gaat over de interne representatie, waarbij delen van die klantgegevens in hun eigen records worden opgeslagen (bv. records voor woonplaats, telefoonnummer, etc.) in een relationeel datamodel - https://www.guru99.com/relational-data-model-dbms.html
30-10-2019, 08:21 door Anoniem
In heel veel gegevensverwerkende systemen worden plukjes gegevens met een vaste indeling gebruikt. Voor een klant kan een klantnummer zijn vastgelegd, een naam, postcode+huisnummer, telefoon etc. Je kan een tabel met klanten maken met voor elk van deze gegevens een kolom en voor elke klant een rij met de waarden voor die klant.

Zo'n rij in de tabel wordt een record genoemd.
30-10-2019, 09:51 door Anoniem
Best een goede vraag, en er is niet echt een helder antwoord. Zoals al gezegd is "een verzameling gegevens van een persoon, ding, of gebeurtenis" een hele aardige samenvatting. Maar het is geen precieze definitie. Voorbeeld.

Vroeger stonden er kaartenbakken in de bibliotheek met van die indexkaarten. Een rij gesorteerd op naam, een rij gesorteerd op titel. Het is natuurlijk te zeggen dat zo'n indexkaart een record is, maar voor elk boek zijn er twee. En dan is er nog het boek, gesorteerd op categorienummer in de boekenkasten. Dus drie zoekmanieren oftewel "sleutels" om op te zoeken.

Gecomputeriseerde records kun je best op meerdere sleutels doorzoeken, dus daar hoef je geen aparte records voor de maken (je voegt een index toe op je tabel). Maar je kan de regels in de tabellen waar een relationele database mee werkt ook opsplitsen en naar elkaar laten verwijzen ("relationeel"). Mischien heeft een boek wel twee auteurs, dus dan staat er in de tabel auteurs-van-boeken twee regels voor dat ene boek, voor iedere auteur een. Zijn die drie regels elk een record, of vormen ze samen een record?

Maar het gebeurt ook wel dat een tabel heel breed is en veel velden heeft die voor de meeste records leeg zijn. Bijvoorbeeld wel tien auteurvelden (auteur1 t/m auteur10 oid.) waar bij de meeste leeg zullen blijven voor de meeste boeken. Dat is niet erg behalve dat het ruimte kost, die vaak relatief kost. Maar wat te doen met deze verhalenbundel met wel twintig auteurs? (Je wijst iemand aan als "editor" en vergeet de rest. Practisch voor boeken, maar kan met andere data lang niet altijd, dus dan worden er soms hele rare bokkesprongen gemaakt. Met dit voorbeeld krijg je dan bijvoorbeeld meerdere records voor hetzelfde boek met verschillende lijsten auteurs.)

De conclusie dat een record met z'n fields attributen van een entiteit beschrijft en er dus maar een record per entiteit zal zijn volgt niet. Je kan zoals we gezien hebben best meerdere records hebben die wijzen naar een entiteit. Stel dat een auteur wel tien boeken geschreven heeft. Dan heb je dus ergens tien regels in een tabel nodig om tien keer die relatie van "deze auteur schreef (mee aan) dat boek" te leggen. Dat "(mee aan)" omdat er best nog een auteur kan zijn die ook aan het boek geschreven heeft. Waarvoor dan ook weer een aparte regel in de tabel staat. Het een sluit het ander niet uit.

Je kan zeggen, we verzinnen een projectie van de heel wat ingewikkeldere data in de database naar een versimpelde voorstelling. En dan tellen we elk boek als een record, en elke auteur ook. Ongeacht hoeveel regels het kost om dat in de database te stoppen. Maarja, er staat nergens een afspraak dat we het zo doen. En zelfs dan is niet iedere dataset eenduidig zo te projecteren.

De belangrijkheid per record is ook al slecht in te schatten. Stel we hebben het over passasiers in vliegtuigen. Is iedere passagier een record, of is ieder vliegtuig (met mischien wel een paar honder passagiers elk) een record? Mischien iedere reis? Maar daar kunnen weer meer vliegtuigen in voorkomen. Iedere individuele passagiersvlucht dan? Maar dat zijn er ruim meer dan verschillende passagiers. Dus hoeveel personen zijn dan precies betroffen, en hoeveel impact is dat per persoon?

Dus wat een "record" precies is, daar zijn geen vaste regels voor, dus moet je weten wat zo'n rapporteur eigenlijk bedoelde. De journo die het opkalkte zal gewoon het nummer van de persvoorlieger overnemen. Dus dan is het even de vraag waar het nummer vandaankomt.

En omdat dat vaak niet te achterhalen valt pak je dan de vuistregel "een record per persoon, ding, of gebeurtenis". Maar hou in het achterhoofd dat het zo simpel allemaal niet hoeft te zijn.
30-10-2019, 16:16 door Erik van Straten
Maatgevend lijkt mij de verwachte gemiddelde en/of worst case schade per persoon wiens gegevens in verkeerde handen gevallen (kunnen) zijn, maal het aantal betrokken personen (vaak 1 record per persoon, maar hoeft niet 1 : 1 te zijn).
30-10-2019, 16:49 door Anoniem
Een rij (meerdere columns) van een database is een record.

Dat kunnen 1000 klanten zijn in de klanten database maar soms kan door andere verslaggeving het ook 100 klanten zijn uit de records van de klanttable en 900 records van bestelde items uit een andere transactietable van een webshop. Eenduidig is het niet. Men zou er bij moeten vermeldingen hoeveel klanten getroffen zijn bij zulke nieuwsgeving.

Net zoals bij verkeersongelukken "er vielen X gevonden en Y doden": "er werden geen/ of X klanten getroffen". De journalistiek moet dit nog regelen. Een open gegeven als een "record" is voor meerdere interpretaties vatbaar.
31-10-2019, 15:36 door Anoniem
Database record -

"A record in a database is an object that can contain one more values. Groups of records are then saved in a table; the table defines the data that each record may contain. In a given database, there are multiple tables, each containing multiple records. Think of the rows and columns of a typical spreadsheet."
01-11-2019, 08:52 door Anoniem
In de fysieke wereld is een record is een dossier. Afhankelijk van het doel bevat dit gegevens. In de digitale wereld is data meestal opgeslagen in een database (joh) en dan zijn bovenstaande antwoorden uitstekend.
Reageren

Deze posting is gelocked. Reageren is niet meer mogelijk.