Datenverschmutzung

Aus MARJORIE-WIKI
Wechseln zu: Navigation, Suche

Als Datenverschmutzung (engl. data contamination) wird bei Informationssystemen und anderen Datenbanken die Minderung der Datenqualität durch ungenaue Datenerhebungen oder -Definitionen, achtlosen Umgang oder andere Verletzung der IT-Compliance bezeichnet.

Im Gegensatz dazu wird er Begriff in letzter Zeit auch für positive Maßnahmen als Beitrag zum Datenschutz und zur Erschwernis von Datenmissbrauch verwendet. Unter anderem bezeichnen Bearbeiter von EDV-gestützter Statistik oder von elektronischen Volkszählungen (Registerzensus) als Datenverschmutzung eine Vorsichtsmaßnahme, die durch teilweise Vermischung von Datensätzen einem gezielten Missbrauch persönlicher Daten vorbeugen soll.[1]

Auch wenn solche Datensätze anonymisiert sind, ist es fachkundigen Bearbeitern oder Hackern möglich, auf die Personen oder auf personenbezogene Attribute zurückzuschließen.[2] Solche Eingriffe werden für gezielte Werbung versucht. Um die Korrektheit größerer Datensätze zu einem gewissen Prozentsatz zu zerstören, werden daher Attribute zwischen verschiedenen Personen vertauscht, (z.B. Hans Meier Weine zu Hans Meier-Weine) was bei einem gezielten, großflächigen Missbrauch ein höheres Risiko der Entdeckung bedeutet.

Wenn diese Vertauschungen systematisch vorgenommen werden, hat die Datenverschmutzung auf die statistische Auswertbarkeit der Datensätze keinen nachteiligen Einfluss.

Siehe auch[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. vgl. dazu einen Bericht im Ö1-Radiokolleg am 14. Oktober 2012
  2. Hintergrundartikel zu einem Teilaspekt des Lemmas
Info Sign.svg Dieser Wikipedia-Artikel wurde, gemäß GFDL, CC-by-sa mit der kompletten History importiert.