Hur hemligt är det? – Aggregerat data

Aggregerat data är när man har beräknat tex ett medelvärde eller ett totalvärde över en hel grupp och ur vilka man inte kan utläsa enskilda händelser eller individer. Det kan tex vara totalt försäljninsvärde eller ett medelvärde för ett blodprov.

Detta är ursprungligen en rad tweets för att ge lite fler exempel.

Låt oss ta ett exempel, vi har följande uppgifter om en grupp personer Namn, Ålder, Hba1c, …
[Hanna, 35, 65, …
Niklas, 25, 52, …
Peter, 50, 53, …
Alice, 55, 67, …
Jenny, 61, 45, …
Lars, 30, 43, …
Armin, 63, 54]

En delmängd av detta data skulle kunna vara att vi tar ut alla uppgifter för alla som är äldre än 60 år.
Namn, Ålder, Hba1c, …
[Jenny, 61, 45, …
Armin, 63, 54]
Detta är inte aggregerat data, utan snarare data som är utsorterat ur en större datamängd.

Låt oss istället beräkna medelvärdet för Hba1c för alla personer: (65+52+53+67+45+43+54)/7=54. Detta är aggregerat data, ny information som satts samman från den totala information, men som inte fanns tillgänglig från början.

Ett annat aggregerat data kan vara medelvärdet för Hba1c för personer över 60 år: (45+54)/2 = 49,5.

Så om du endast får ut aggregerat data behöver du förklara vilket data du vill ha ut, den som är ansvarig för att dela ut det aggregerade datat behöver göra en rad beräkningar, i detta exemplet medelvärdesberäkningar, innan data sedan lämnas ut.

Detta innebär bland annat att du inte kan beräkna andra saker som du är intresserad av, tex medelvärdet för alla under 40 år. Helt enkelt för att du inte fått tillräckligt mycket information utlämnad till dig.

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *