Aktuelle Beiträge
Lade Beiträge…
📰 Alle Beiträge 📬 Newsletter
Daten

Feature

Ein Feature (Merkmal) ist im Machine Learning eine einzelne messbare Eigenschaft einer Eingabe, die das Modell zur Vorhersage nutzt. Features sind die „Sprache", durch die das Modell die Daten sieht.

In tabellarischen Daten: Jede Spalte ist ein Feature — Alter, Einkommen, Postleitzahl, Beruf. In Bildern: Rohfeatures sind Pixelwerte; gelernte Features (durch ein CNN) sind Kanten, Texturen, Formen, Objektteile. In Text: Rohfeatures können Wortfrequenzen (Bag of Words), TF-IDF-Werte oder kontextualisierte Embeddings sein.

Die Qualität der Features bestimmt die Qualität des Modells. Andrew Ng: „Applied machine learning is basically feature engineering." Ein Kreditscoring-Modell, das nur das Einkommen als Feature hat, ist schlechter als eines mit Dutzenden sorgfältig konstruierter Features: Schulden-Einkommens-Verhältnis, Zahlungspünktlichkeit, Kontohistorie, Beschäftigungsstabilität.

Feature Engineering: Die manuelle Konstruktion aussagekräftiger Features aus Rohdaten. Automatisierte Feature Engineering-Tools (Featuretools, TPOT) können kombinatorische Features erzeugen, ersetzen aber nicht das Domänenwissen.

Feature Selection: Die Auswahl der relevantesten Features aus einer großen Menge. Filter-Methoden (Korrelation, Chi²), Wrapper-Methoden (Recursive Feature Elimination), Embedded-Methoden (L1-Regularisierung, Tree Importance). Irrelevante Features hinzuzufügen verschlechtert oft die Performance — weniger, aber bessere Features sind mehr.

Deep Learning hat das Feature-Paradigma verändert: Das Netz lernt seine eigenen Features (Representation Learning). Trotzdem bleibt die Datenaufberichterstattung — und damit implizit die Feature-Qualität — entscheidend.

Input