Aktuelle Beiträge
Lade Beiträge…
📰 Alle Beiträge 📬 Newsletter
Technik

Codec

Ein Codec (Coder-Decoder) ist ein Algorithmus, der Daten komprimiert (enkodiert) und dekomprimiert — ursprünglich ein Kern der Audio- und Videotechnik, heute zunehmend relevant für KI-basierte Medienverarbeitung.

Klassische Codecs wie H.264, H.265 (HEVC) und AV1 komprimieren Videos mit handgefertigten Algorithmen: Bewegungsvorhersage, Frequenztransformation, Entropiekodierung. Sie sind extrem optimiert, aber fundamentalsch limitiert — sie verstehen den Inhalt des Videos nicht.

KI-basierte Codecs verändern das Spiel. Googles SoundStream und Metas EnCodec komprimieren Audio auf Bruchteile der bisherigen Bitrate, weil sie gelernte Repräsentationen verwenden: Das Modell versteht, was Sprache ist, und kann sie effizienter kodieren als ein allgemeiner Algorithmus. Die Qualität bei 1.5 kbit/s ist vergleichbar mit klassischen Codecs bei 12 kbit/s.

Für Videokonferenzen bedeutet das: Ein KI-Codec könnte ein Porträtvideo mit wenigen Kilobits pro Sekunde übertragen, indem nur die Veränderungen im Gesichtsausdruck kodiert werden — den Hintergrund und die statischen Merkmale synthetisiert die KI am anderen Ende. Nvidia Maxine demonstrierte das Prinzip bereits 2020.

Die Implikation für generative KI: Die Architektur vieler Bildgenerierungsmodelle (Stable Diffusion, DALL-E) nutzt im Kern einen Autoencoder als Codec — das Bild wird in einen komprimierten Latent Space kodiert, dort manipuliert und dann dekodiert.

Data