Zum Inhalt springen KI-Lexikon — Die KI Woche
Aktuelle Beiträge
Lade Beiträge…
📰 Alle Beiträge 📬 Newsletter
Software

Database

Eine Datenbank (Database) ist ein System zur organisierten Speicherung, Abfrage und Verwaltung von Daten. Im KI-Kontext hat sich die Datenbanklandschaft um eine neue Kategorie erweitert: Vektordatenbanken.

Relationale Datenbanken (MySQL, PostgreSQL, Oracle) speichern Daten in Tabellen mit Zeilen und Spalten, verknüpft über Schlüssel. Sie sind seit den 1970ern (E.F. Codd) der Standard für strukturierte Daten und werden durch SQL abgefragt.

NoSQL-Datenbanken (MongoDB, Cassandra, Redis) entstanden für Anwendungsfälle, die relationale Modelle schlecht bedienen: unstrukturierte Dokumente, Schlüssel-Wert-Paare, Graphen, Zeitreihen.

Vektordatenbanken sind die KI-spezifische Innovation. Pinecone, Weaviate, Chroma, Qdrant und Milvus speichern hochdimensionale Vektoren (Embeddings) und ermöglichen ultraschnelle Ähnlichkeitssuche: „Finde die 10 ähnlichsten Dokumente zu diesem Query-Vektor." Das ist die technische Grundlage für RAG (Retrieval-Augmented Generation), semantische Suche und Empfehlungssysteme.

Die Konvergenz beschleunigt sich: PostgreSQL bietet mit pgvector eine Vektorsucherweiterung. Elasticsearch integriert Dense Vector Search. Die Frage „eigene Vektordatenbank oder Erweiterung einer bestehenden?" ist eine aktive Debatte.

Für ML-Training sind Datenbanken Datenquellen — Feature Stores (Feast, Tecton) abstrahieren den Zugriff und stellen sicher, dass dasselbe Feature sowohl im Training als auch in der Inferenz identisch berechnet wird.

Storage
🔗 Link kopiert!