Während die westliche KI-Szene noch über OpenAIs mysteriöse „Tape"-Modelle rätselt, hat Alibaba Fakten geschaffen: Mit Wan 2.7 stellt der chinesische Tech-Konzern ein vollständig überarbeitetes Open-Source-System vor, das Bild- und Videogenerierung auf ein neues Level hebt — und gleichzeitig auf wan.video für jeden frei zugänglich macht.
Ein Modell, das alles kann: Wan 2.7 Image
Das Herzstück der Neuveröffentlichung ist Wan 2.7 Image, ein sogenanntes „Unified Model". Statt wie bisher separate Systeme für Bildgenerierung und Bildbearbeitung zu nutzen, vereint Wan 2.7 beide Fähigkeiten in einer einzigen Architektur. Konkret bedeutet das: Dasselbe Modell, das fotorealistische Gesichter mit kontrollierbarer Knochenstruktur und Augenform erzeugt, kann anschließend Farben per HEX-Code anpassen, Text in zwölf Sprachen druckfähig einbetten oder bis zu zwölf konsistente Varianten eines Motivs in einem Durchlauf generieren.
Besonders bemerkenswert ist das Textrendering: Wan 2.7 Image verarbeitet bis zu 3.000 Token Text — genug für ganze Absätze auf Postern oder Infografiken. Eine Fähigkeit, an der selbst Midjourney und DALL-E 3 bisher scheitern, und die erst mit den jüngsten „Tape"-Modellen von OpenAI überhaupt in Sichtweite gerückt ist.
Nicht neu generieren, nur editieren: Wan 2.7 Video
Zwei Tage nach dem Image-Modell folgte Wan 2.7 Video. Alibabas Videogenerator setzt auf ein Prinzip, das die gesamte Branche aufhorchen lässt: Instruction Editing. Statt ein Video komplett neu zu generieren, wenn ein Detail nicht stimmt — etwa das Wetter, ein Kleidungsstück oder der Kamerawinkel —, ändert man es per Textbefehl nachträglich. Der Slogan: „Don't re-generate. Just edit."
Hinzu kommen zwei Features, die bisherige KI-Videogeneratoren regelmäßig in die Knie zwingen: Multi-Subject Consistency, also die Fähigkeit, bis zu fünf Personen, Objekte oder Tiere über verschiedene Szenen hinweg visuell stabil zu halten, sowie stabile 15-Sekunden-Sequenzen mit kinematischer Flüssigkeit. Des Weiteren beherrscht das Modell die Replikation von Kamerabewegungen und die nahtlose Verlängerung bestehender Szenen.
Von Workflow-Engine bis Cloud-API: Das Ökosystem steht ab Tag eins
Was Wan 2.7 von vielen Modell-Ankündigungen unterscheidet, ist die sofortige Verfügbarkeit quer durch die gesamte KI-Infrastruktur-Kette. Bereits am Launchtag war das Modell in ComfyUI integriert — der populärsten nodbasierten Open-Source-Workflow-Engine, mit der Kreative komplexe Bild- und Video-Pipelines visuell zusammenbauen, ohne eine Zeile Code zu schreiben. ComfyUI beschrieb die neue Version als „umfassendes Upgrade" mit Verbesserungen bei Bildqualität, Audio, Motion Dynamics und Stilisierung.
Parallel stellte WaveSpeed AI, ein auf Hochgeschwindigkeits-Inferenz spezialisierter Model-as-a-Service-Anbieter, die gesamte Wan-2.7-Pipeline als gehostete API bereit — inklusive kostenloser Credits zum Testen.
Auch fal.ai, eine serverlose GPU-Plattform, die automatisch von null auf tausende GPUs skaliert und damit vor allem Entwicklerteams anspricht, nahm Wan 2.7 unmittelbar ins Programm — ein weiteres Zeichen dafür, wie schnell das Open-Source-Ökosystem auf Alibabas Veröffentlichung reagiert hat.
Zusätzlich stellt Alibaba Cloud eine offene API bereit.
Dass sich Alibaba am selben Tag mit Qwen 3.6 Plus auch im Sprachmodell-Sektor aggressiv positioniert hat (→ KI Woche Analyse), zeigt die Breite der Offensive: Von Text über Bild bis Video baut der Konzern ein komplettes Open-Source-Ökosystem — und setzt damit westliche Anbieter unter erheblichen Druck.
🎯 Was das für die Praxis bedeutet
1. Instruction Editing testen: Marketing- und Kreativteams, die heute mit mehrfacher Videogenerierung kämpfen, um ein Detail zu korrigieren, sollten Wan 2.7 Video auf wan.video ausprobieren — der Zeitgewinn durch nachträgliches Editieren statt Neugenerierung kann erheblich sein.
2. ComfyUI-Workflows erweitern: Wer bereits mit ComfyUI arbeitet, kann das Wan-2.7-Partner-Node direkt in bestehende Pipelines integrieren und so Bild- und Video-Workflows in einer Oberfläche vereinen.
3. Open Source als strategische Option: Die sofortige API-Verfügbarkeit macht Wan 2.7 zu einer ernstzunehmenden Alternative zu proprietären Diensten wie Runway oder dem eingestellten Sora — besonders für Teams, die Datenhoheit oder Kosteneffizienz priorisieren.