Optimierung
Quantization
Quantisierung reduziert die Genauigkeit der Zahlen in einem Modell (z.B. von 32-bit Fließkomma auf 8-bit Integer), um das Modell kleiner und schneller zu machen. Oft verliert man dabei kaum an Qualität, spart aber massiv Speicher. Wichtig für Edge AI.