Domain
Domain (Domäne) bezeichnet im KI-Kontext den spezifischen Anwendungsbereich, in dem ein Modell eingesetzt wird — Medizin, Finanzen, Recht, Fertigung, Sprachverarbeitung, Bildanalyse oder Dutzende andere.
Die Domäne bestimmt alles: welche Daten verfügbar sind, welche Metriken relevant sind, welche Fehler akzeptabel sind und welche regulatorischen Anforderungen gelten. Ein Modell, das in der medizinischen Diagnostik eingesetzt wird, unterliegt ganz anderen Anforderungen als eines für Produktempfehlungen.
Domain Adaptation ist die technische Herausforderung, ein Modell von einer Domäne auf eine andere zu übertragen. Ein auf englischen Zeitungsartikeln trainiertes NER-Modell funktioniert schlecht bei medizinischen Fachartikeln — andere Terminologie, andere Entitätstypen, andere Satzstrukturen.
Transfer Learning adressiert das Problem: Ein vortrainiertes Modell (GPT, BERT, ResNet) erfasst allgemeine Muster und wird dann auf die Zieldomäne feingetuned. Die Datenmenge, die für das Feintuning nötig ist, ist typischerweise um Größenordnungen kleiner als das vom Scratch-Training.
Domain-Specific Models werden zunehmend populär: Med-PaLM (medizinisch), BloombergGPT (Finanzen), CodeLlama (Programmierung), BioGPT (Biomedizin). Sie kombinieren die allgemeinen Fähigkeiten eines Foundation Models mit domänenspezifischem Wissen.
Die offene Frage: Werden spezialisierte Domänenmodelle relevant bleiben, wenn General-Purpose-Modelle wie GPT-4 immer leistungsfähiger werden? Die aktuelle Antwort: Für regulierte oder hochspezialisierte Domänen ja, für breite Anwendungen zunehmend nein.