CNN

Feature Map

Eine Feature Map ist die Ausgabe eines Convolutional Layers — eine 2D-Matrix, die zeigt, wo im Eingabebild ein bestimmtes gelerntes Muster (Feature) vorkommt.

Ein Convolutional Layer mit 64 Filtern erzeugt 64 Feature Maps: Jede Map zeigt die Aktivierungen eines spezifischen Filters — z.B. „horizontale Kante oben links" oder „rotes Farbmuster in der Mitte." Je höher der Wert an einer Position, desto stärker ist das Muster an dieser Stelle vorhanden.

In den ersten Schichten eines CNN zeigen Feature Maps einfache Muster: Kanten, Farbgradienten, Texturen. In mittleren Schichten: Ecken, Kreise, einfache Formen. In tiefen Schichten: Ganze Objektteile (Augen, Räder, Fenster). Die letzten Feature Maps vor dem Klassifikations-Layer enthalten die abstraktesten, aufgabenrelevantesten Repräsentationen.

Die Visualisierung von Feature Maps ist ein wichtiges Tool für das Modellverständnis (Interpretability). Zeiler und Fergus (2014) visualisierten systematisch, was jede Schicht eines CNN lernt, und zeigten die hierarchische Feature-Struktur.

Technisch: Eine Feature Map hat die Dimensionen (Höhe × Breite), wobei Höhe und Breite durch Stride und Pooling mit jeder Schicht kleiner werden. Die gesamte Ausgabe eines Convolutional Layers ist ein 3D-Tensor: (Anzahl_Filter × Höhe × Breite).

In der Transformer-Vision (ViT): Obwohl Vision Transformers keine Convolutions nutzen, erzeugen sie analoge „Feature Maps" — Attention-Muster, die zeigen, auf welche Bildregionen das Modell für seine Entscheidung achtet.

Internal

Feature Map

Verwandte Begriffe

Fehler melden

Die KI Woche als App