Zum Inhalt springen
Aktuelle Beiträge
Lade Beiträge…
📰 Alle Beiträge 📬 Newsletter
⚙️ Training & Optimierung Standard

Federated Learning

Federated Learning (Föderiertes Lernen) trainiert ML-Modelle auf verteilten Daten, ohne dass die Daten jemals ihren Standort verlassen — die Daten bleiben auf den Endgeräten, nur die Modellaktualisierungen werden geteilt. Google führte das Konzept 2016 ein (McMahan et al., „Communication-Efficient Learning of Deep Networks from Decentralized Data"). Der Anwendungsfall: Googles Gboard-Tastatur lernt Wortvorhersagen aus dem Tippverhalten von Millionen Nutzern — aber statt die Texte in die Cloud zu senden, wird das Modell lokal auf jedem Gerät trainiert und nur die Modellgewicht-Updates (Gradienten) werden aggregiert. Der Ablauf: 1. Server verteilt das aktuelle Modell an eine Auswahl von Clients. 2. Jeder Client trainiert das Modell lokal auf seinen eigenen Daten. 3. Die Clients senden nur die Modellaktualisierungen (nicht die Daten) an den Server. 4. Der Server aggregiert die Updates (typischerweise durch Mittelung — Federated Averaging, FedAvg) und verteilt das verbesserte Modell. Vorteile: Datenschutz (sensible Daten verlassen nie das Gerät), Compliance (DSGVO-freundlich, kein zentraler Datenspeicher), Nutzung dezentraler Datenquellen (Krankenhäuser können gemeinsam ein Modell trainieren, ohne Patientendaten zu teilen). Herausforderungen: Nicht-IID-Daten (die Daten auf verschiedenen Geräten sind oft sehr unterschiedlich verteilt), Kommunikationskosten (Modellaktualisierungen über Mobilfunknetze), heterogene Hardware (verschiedene Geräte haben unterschiedliche Rechenleistung) und Sicherheitsrisiken (Model Poisoning durch manipulierte Clients). Differential Privacy ergänzt Federated Learning: Rauschen wird zu den Gradienten addiert, um zu verhindern, dass aus den Updates auf individuelle Datenpunkte geschlossen werden kann.
Privacy Distributed
🔗 Link kopiert!