Aktuelle Beiträge
Lade Beiträge…
📰 Alle Beiträge 📬 Newsletter
Daten

Attribute

Ein Attribut — auch Feature oder Merkmal genannt — ist eine einzelne messbare Eigenschaft einer Dateneinheit. In einer Tabelle ist ein Attribut eine Spalte: „Alter", „Einkommen", „Postleitzahl", „Diagnose".

Im maschinellen Lernen sind Attribute die Sprache, in der das Modell die Welt sieht. Ein Kreditscoring-Modell bekommt Attribute wie Einkommen, Schuldenstand, Zahlungshistorie und Beschäftigungsdauer — und muss daraus das Ausfallrisiko vorhersagen. Die Qualität der Attribute bestimmt die Qualität des Modells fundamental: das alte Datenanalyse-Sprichwort „Garbage in, garbage out" gilt unverändert.

Feature Engineering — die Kunst, aus Rohdaten aussagekräftige Attribute zu konstruieren — war traditionell der arbeitsintensivste Teil des ML-Prozesses. Ein erfahrener Data Scientist könnte aus einem Datumsstempel die Attribute „Wochentag", „Monat", „Feiertag ja/nein" und „Tage seit letzter Transaktion" extrahieren, weil er weiß, dass diese für die Vorhersage relevant sind.

Deep Learning hat Feature Engineering teilweise automatisiert: Ein CNN lernt selbst, welche Bildmerkmale relevant sind, statt dass ein Mensch Kanten, Texturen und Formen manuell definieren muss. Trotzdem bleibt die Auswahl und Aufbereitung der Eingabedaten entscheidend — insbesondere bei tabellarischen Daten, wo klassische Methoden (XGBoost, LightGBM) nach wie vor oft besser funktionieren als Deep Learning.

Feature