Aktuelle Beiträge
Lade Beiträge…
📰 Alle Beiträge 📬 Newsletter
Tools

DALL-E

DALL-E, benannt nach einer Kombination aus Salvador Dalí und dem Pixar-Roboter WALL-E, ist OpenAIs Familie von Bildgenerierungsmodellen — und der Auslöser der kreativen KI-Revolution.

DALL-E 1 (Januar 2021) demonstrierte erstmals überzeugend, dass ein neuronales Netz aus natürlichsprachlichen Beschreibungen Bilder erzeugen kann: „ein Sessel in der Form einer Avocado" — und heraus kam ein plausibles Bild. Die Architektur basierte auf einem diskreten VAE kombiniert mit GPT-3.

DALL-E 2 (April 2022) war ein Qualitätssprung. Es nutzte ein Diffusionsmodell statt eines VAE und erzeugte fotorealistische Bilder in hoher Auflösung. Die Fähigkeit, bestehende Bilder zu bearbeiten (Inpainting, Variations) und verschiedene Stile zu imitieren, machte es zum ersten massentauglichen KI-Bildgenerator.

DALL-E 3 (September 2023) wurde direkt in ChatGPT integriert und löste das Prompt-Engineering-Problem: Statt komplizierte Prompts formulieren zu müssen, beschreibt der Nutzer sein Bild in natürlicher Sprache, und ChatGPT optimiert den Prompt automatisch. Die Textdarstellung in Bildern verbesserte sich dramatisch.

Die Debatte um DALL-E ist stellvertretend für die gesamte generative KI: Künstler sehen ihre Arbeit entwertet (das Modell wurde auf Milliarden Bildern trainiert, darunter künstlerische Werke). Befürworter sehen Demokratisierung kreativer Fähigkeiten. Die Folgen für Design, Illustration, Werbung und Fotografie sind bereits spürbar — aber die volle Wirkung wird sich erst in den kommenden Jahren zeigen.

Image Gen OpenAI