Hur hemligt är det? – Identifierat, avidentifierat och anonymt

”Det är inget konstigt att dela med sig, det är anonymt.” Något man ofta får höra när det gäller olika undersökningar eller dela med sig av sin data. Men det stämmer sällan.

Låt oss titta på olika typer av individdata:
1. Identifierade
2. Avidentifierat / Pseudonymiserade
3. Anonymiserade

1. I identifierade data finns tydlig identifierare. Kan vara personnummer, namn & adress ELLER t ex löpnummer som av forskargruppen eller annan kan kopplas till en viss individ. Viktigt: sammanställning utan id men där det är enkelt koppla till id är identifierade data.

2. Avidentifierade data är individdata där varje individ identifieras med pseudonym t ex löpnummer men där forskargruppen saknar nyckel som kopplar pseudonymen till en viss identifierad individ. Ett annat namn för avidentifierade data är pseudonymiserade data. Detta är inte anonyma data (!) eftersom bakvägsidentifiering ofta är möjlig.

Bakvägsidentifiering innebär möjlighet att genom detaljerade uppgifter på individnivå identifiera en, flera eller alla individer. Kan röra sig om datum för viss åtgärd vid viss enhet, flytt mellan 2 kommuner ett visst månadsskifte, ovanlig diagnos eller mycket hög ålder. Pseudonymiserade data är därför INTE anonymiserade.

3. Anonyma individdata är pseudonymiserade individdata där datamängden (fr a variabler) reducerats så kraftigt att bakvägsidentifiering inte är möjlig. Utlämnande enhet måste ha genomfört en menprövning av detta. Idag är det en begränsad efterfrågan av sådana datafiler men i framtiden kan sådana uttag komma att efterfrågas i högre grad för att bilda underlag för artificiell intelligens, AI.

Den typ av data som forskare samt life science-företag idag oftast efterfrågar är pseudonymiserade data. Detta får INTE kallas anonyma data för det är inte anonyma data. Det datat får bara lämnas ut efter etisk prövning, bara användas för visst angivet ändamål och måste hanteras som det känsliga personregister det är där enskilda individer kan bakvägsidentifieras.

Majoriteten av denna text kommer från Mikael Hoffmann, stiftelsen NEPI – nätverk för läkemedelsepidemiologi. Tack för en bra beskrivning!

Vill du veta mer om egenvård, data och annan teknik. Håll utkik, det kommer fler inlägg på samma tema. Är det nåt speciellt ni vill veta, ställ frågor!

Lämna ett svar

E-postadressen publiceras inte. Obligatoriska fält är märkta *