Zum Inhalt springen KI-Lexikon — Die KI Woche
Aktuelle Beiträge
Lade Beiträge…
📰 Alle Beiträge 📬 Newsletter
Vorgang

Deletion

Deletion im KI-Kontext hat mehrere Dimensionen: das Löschen von Daten aus Trainingsdatensätzen, das Löschen persönlicher Informationen aus trainierten Modellen und das Löschen ganzer Modelle oder Modellversionen.

Das Recht auf Löschung (Art. 17 DSGVO, „Recht auf Vergessenwerden") stellt die KI-Branche vor ein fundamentales Problem: Kann man Daten aus einem bereits trainierten Modell entfernen? Wenn ein Nutzer verlangt, dass seine persönlichen Daten gelöscht werden, reicht es nicht, sie aus dem Trainingsdatensatz zu entfernen — das Modell hat die Muster bereits internalisiert.

Machine Unlearning ist das aktive Forschungsgebiet, das dieses Problem adressiert. Der naive Ansatz — das Modell ohne die zu löschenden Daten komplett neu trainieren — ist bei Milliarden-Parameter-Modellen prohibitiv teuer. Effiziente Methoden wie SISA (Sharded, Isolated, Sliced, and Aggregated Training, Bourtoule et al., 2021) partitionieren das Training so, dass einzelne Datenpunkte durch Retraining nur eines Shards entfernt werden können.

In der Praxis bleibt unklar, ob Machine Unlearning vollständig funktioniert — ob die „Erinnerung" an die gelöschten Daten wirklich beseitigt ist oder ob subtile Spuren im Modell verbleiben. Das Thema ist rechtlich brisant: Wenn ein KI-Anbieter einem Löschantrag nicht nachkommen kann, verstößt er potenziell gegen die DSGVO.

Daten-Löschung in Pipelines ist dagegen ein operatives Thema: Data Retention Policies, automatisierte Löschung nach Ablauf der Aufbewahrungsfrist und die Sicherstellung, dass Löschungen über alle Kopien und Backups konsistent durchgeführt werden.

Data
🔗 Link kopiert!