🧠 Modelle & Architekturen Standard

Vision Transformer (ViT)

Der Vision Transformer wendet die reine Transformer-Architektur (ursprünglich für Text) auf Bilder an. Man zerlegt das Bild in kleine Quadrate ('Patches'), behandelt sie wie Wörter in einem Satz und füttert sie in einen Transformer. ViTs haben CNNs in vielen Bereichen als State-of-the-Art abgelöst.

Quellen & Referenzen

Vaswani et al.: Attention Is All You Need (2017)
Neural Network Architectures — Papers with Code

Vision

Aktuell

Aktuell

Aktuell

Aktuell

Aktuell

Die KI Woche — Podcast Show

Markus M. Kirchmair

Podcast Show

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

Vision Transformer (ViT)

Quellen & Referenzen

Die KI Woche als App

Podcast Show

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

Vision Transformer (ViT)

Quellen & Referenzen

Verwandte Begriffe

Fehler melden

Die KI Woche als App