Attribute
Ein Attribut — auch Feature oder Merkmal genannt — ist eine einzelne messbare Eigenschaft einer Dateneinheit. In einer Tabelle ist ein Attribut eine Spalte: „Alter", „Einkommen", „Postleitzahl", „Diagnose".
Im maschinellen Lernen sind Attribute die Sprache, in der das Modell die Welt sieht. Ein Kreditscoring-Modell bekommt Attribute wie Einkommen, Schuldenstand, Zahlungshistorie und Beschäftigungsdauer — und muss daraus das Ausfallrisiko vorhersagen. Die Qualität der Attribute bestimmt die Qualität des Modells fundamental: das alte Datenanalyse-Sprichwort „Garbage in, garbage out" gilt unverändert.
Feature Engineering — die Kunst, aus Rohdaten aussagekräftige Attribute zu konstruieren — war traditionell der arbeitsintensivste Teil des ML-Prozesses. Ein erfahrener Data Scientist könnte aus einem Datumsstempel die Attribute „Wochentag", „Monat", „Feiertag ja/nein" und „Tage seit letzter Transaktion" extrahieren, weil er weiß, dass diese für die Vorhersage relevant sind.
Deep Learning hat Feature Engineering teilweise automatisiert: Ein CNN lernt selbst, welche Bildmerkmale relevant sind, statt dass ein Mensch Kanten, Texturen und Formen manuell definieren muss. Trotzdem bleibt die Auswahl und Aufbereitung der Eingabedaten entscheidend — insbesondere bei tabellarischen Daten, wo klassische Methoden (XGBoost, LightGBM) nach wie vor oft besser funktionieren als Deep Learning.