Aktuelle Beiträge
Lade Beiträge…
📰 Alle Beiträge 📬 Newsletter
Daten

Dark Data

Dark Data bezeichnet die Daten, die ein Unternehmen sammelt und speichert, aber nie analysiert oder nutzt. Schätzungen zufolge fallen 60 bis 90 Prozent der Unternehmensdaten in diese Kategorie.

E-Mail-Archive, Server-Logs, unstrukturierte Support-Tickets, alte Verträge in PDF-Form, Abteilungs-Spreadsheets, vergessene Datenbanken — all das ist Dark Data. Es kostet Geld (Speicher, Verwaltung, Compliance), liefert aber keinen Erkenntnisgewinn.

Gartner, das den Begriff 2012 prägte, definiert Dark Data als „Informationsressourcen, die Organisationen im regulären Geschäftsbetrieb sammeln, verarbeiten und speichern, die aber für keinen anderen Zweck genutzt werden." Die Analogie zur Dunklen Materie in der Physik ist beabsichtigt: vorhanden, aber unsichtbar.

KI kann Dark Data potenziell erschließen. LLMs können unstrukturierte Dokumente analysieren, die bisher nicht durchsuchbar waren. Computer Vision kann Archive von Bildern und Scans verarbeiten. Speech-to-Text kann Stunden von Telefonmitschnitten transkribieren.

Die Risiken sind allerdings erheblich. Dark Data kann personenbezogene Informationen enthalten, deren Speicherung gegen die DSGVO verstößt. Je länger Daten gespeichert werden, desto größer das Risiko eines Datenlecks. Und die Analyse vergessener Daten kann überraschende (und unangenehme) Erkenntnisse zutage fördern.

Die pragmatische Empfehlung: Vor der KI-gestützten Analyse steht die Datenbereinigung. Was nicht benötigt wird, sollte gelöscht werden — das spart Kosten, reduziert Risiken und fokussiert die Analysekapazität auf wertvolle Datenquellen.

Waste