Domain Knowledge
Domain Knowledge (Domänenwissen, Fachwissen) ist das spezifische Wissen über einen Anwendungsbereich, das für die erfolgreiche Entwicklung von ML-Systemen unverzichtbar ist — und das kein Algorithmus allein ersetzen kann.
Ein Beispiel: Ein Data Scientist ohne medizinisches Wissen könnte ein Modell bauen, das Krebs aus Röntgenbildern erkennt. Aber ohne Domänenwissen wird er kritische Fehler machen: falsche Datenaugmentierungen (Bilder spiegeln ändert die Interpretation), irrelevante Features einbeziehen (das Kliniklogo korreliert mit der Diagnose, weil bestimmte Kliniken mehr Krebspatienten haben) oder die falschen Metriken wählen (Accuracy statt Recall bei seltenen Erkrankungen).
Feature Engineering ist die sichtbarste Manifestation von Domänenwissen. Welche Merkmale aus den Rohdaten sind relevant? In der Kreditbewertung: Nicht das absolute Einkommen, sondern das Verhältnis Schulden zu Einkommen. In der Betrugserkennung: Nicht die Transaktionshöhe, sondern die Abweichung vom typischen Verhalten.
Die Spannung zwischen Data-Driven und Domain-Driven: Deep Learning braucht weniger explizites Domänenwissen als klassisches ML (das Modell lernt Features selbst). Aber die Problemformulierung, die Datenkuratierung, die Evaluation und die Interpretation der Ergebnisse erfordern nach wie vor menschliches Fachwissen.
Andrew Ng empfiehlt die Zusammenarbeit von ML-Engineers und Domänenexperten als Erfolgsfaktor Nr. 1 für angewandte KI-Projekte. Die besten Modelle entstehen dort, wo technisches Können und Fachexpertise zusammentreffen.