Class
Eine Class (Klasse) im Machine Learning ist eine der möglichen Kategorien, denen ein Modell eine Eingabe zuordnen kann. Bei binärer Klassifikation gibt es zwei Klassen (Spam/nicht Spam), bei Multi-Class-Klassifikation mehrere (Hund/Katze/Vogel/Fisch).
Klassen definieren, was ein Modell lernen soll. Die Qualität der Klassendefinition bestimmt direkt die Nützlichkeit des Modells. Ein Modell, das Hunderte Hunderassen unterscheidet, braucht andere Trainingsdaten als eines, das nur „Hund" vs. „nicht Hund" erkennt.
In der Praxis gibt es subtile Herausforderungen. Klassen sind oft unscharf: Ist ein Hotdog ein Sandwich? Gehört ein Tomaten-Post auf Instagram zur Klasse „Food" oder „Gardening"? Menschliche Annotatoren sind sich selbst bei scheinbar klaren Kategorien in 10-20% der Fälle uneinig (Inter-Annotator Agreement).
Multi-Label-Klassifikation erlaubt mehrere Klassen pro Eingabe — ein Foto kann gleichzeitig „Strand", „Sonnenuntergang" und „Menschen" sein. Hierarchische Klassifikation ordnet Klassen in Baumstrukturen: Tier → Säugetier → Hund → Labrador.
Das Softmax-Layer am Ende eines Klassifikations-Netzes berechnet eine Wahrscheinlichkeitsverteilung über alle Klassen. Die Klasse mit der höchsten Wahrscheinlichkeit wird als Vorhersage gewählt (Argmax). Die Wahrscheinlichkeiten selbst sind oft schlecht kalibriert — ein Modell, das „97% Hund" sagt, liegt nicht zwingend in 97% der Fälle richtig. Temperature Scaling ist eine gängige Methode der Nachkalibrierung.