CNN

Filter

Ein Filter (auch Kernel) in einem Convolutional Neural Network ist eine kleine Gewichtsmatrix (typisch 3×3 oder 5×5), die über das Eingabebild gleitet und an jeder Position ein Dot Product mit dem darunterliegenden Bildausschnitt berechnet. Das Ergebnis: Eine Feature Map, die zeigt, wo im Bild das gelernte Muster vorkommt.

Die ersten Layer lernen einfache Filter: Kantendetektoren (horizontal, vertikal, diagonal), Farbgradienten, Blobs. Die Visualisierung dieser gelernten Filter zeigt Muster, die den handgefertigten Sobel- und Gabor-Filtern aus der klassischen Bildverarbeitung ähneln. Tiefere Layer lernen zunehmend abstrakte Filter: Texturen, Formen, Objektteile.

Die Convolution-Operation: Der Filter gleitet mit einem Stride (Schrittweite) über das Bild. Bei Stride 1 bewegt er sich pixelweise, bei Stride 2 überspringt er ein Pixel — was die Output-Auflösung halbiert. Padding (Auffüllung mit Null-Pixeln am Rand) kontrolliert die Ausgabegröße.

Die Parameterersparnis gegenüber Dense Layers ist enorm: Ein 3×3-Filter hat nur 9 Gewichte (+ Bias) — dieselben Gewichte werden an jeder Position angewendet (Weight Sharing). Ein Dense Layer für ein 224×224-Bild hätte über 50.000 Gewichte pro Neuron. Diese Invarianz gegenüber der Position ist eine Induktive Bias: Das gleiche Muster (z.B. eine Kante) soll überall im Bild erkannt werden.

Die Anzahl der Filter pro Layer bestimmt die „Breite" des Netzes. Typisch: 64 Filter im ersten Block, 128, 256, 512 in den folgenden — mehr Filter = mehr Muster gelernt.

Kernel

Filter

Verwandte Begriffe

Fehler melden

Die KI Woche als App