Zum Inhalt springen KI-Lexikon — Die KI Woche
Aktuelle Beiträge
Lade Beiträge…
📰 Alle Beiträge 📬 Newsletter
Clustering

Centroid

Ein Centroid ist der geometrische Mittelpunkt einer Datenmenge — der Durchschnitt aller Punkte in einem Cluster. Im Machine Learning ist er die tragende Säule des K-Means-Algorithmus, eines der ältesten und verbreitetsten Clustering-Verfahren.

K-Means arbeitet iterativ: Zufällig platzierte Centroids werden schrittweise verschoben, bis sie die natürlichen Gruppierungen in den Daten widerspiegeln. Jeder Datenpunkt wird dem nächsten Centroid zugeordnet, dann wird jeder Centroid als Mittelwert seiner zugeordneten Punkte neu berechnet. Dieses Verfahren konvergiert typischerweise in wenigen Dutzend Iterationen.

Die Schwäche: Centroids setzen voraus, dass Cluster konvex und kugelförmig sind. Längliche oder verschlungene Cluster werden schlecht erfasst — dafür eignen sich Verfahren wie DBSCAN oder Spectral Clustering besser. Außerdem ist die Anzahl der Cluster (K) ein Hyperparameter, den man vorab festlegen muss. Methoden wie der Elbow-Plot oder der Silhouette-Score helfen bei der Wahl.

In der KI-Praxis wird Centroid-basiertes Clustering für Kundensegmentierung, Farbreduktion in Bildern, Dokumentengruppierung und als Vorverarbeitungsschritt für andere Algorithmen eingesetzt. In der Vektorsuche (z.B. FAISS von Meta) werden Centroids verwendet, um den Suchraum zu partitionieren und ähnliche Vektoren schneller zu finden.

Math
🔗 Link kopiert!