Microsoft hat drei hauseigene KI-Modelle vorgestellt, die allesamt auf Spitzenpositionen in ihren Disziplinen zielen — und dabei kein einziges Mal OpenAI erwähnen. MAI-Transcribe-1 für Sprache-zu-Text, MAI-Voice-1 für Stimmgenerierung und MAI-Image-2 für Bildproduktion stehen ab sofort über Microsoft Foundry zur Verfügung (Microsoft AI).
Weltbeste Transkription, natürliche Stimmen, konkurrenzfähige Bilder
MAI-Transcribe-1 ist laut FLEURS-Benchmark das genaueste Transkriptionsmodell der Welt — in 11 von 25 unterstützten Sprachen auf Platz 1. Dabei arbeitet es 2,5-mal schneller als Microsofts bisheriges Azure-Fast-Angebot und startet bei 0,36 Dollar pro Stunde. MAI-Voice-1 generiert aus wenigen Sekunden Audiomaterial individuell klingende Stimmen und produziert 60 Sekunden Sprache in einer einzigen Sekunde. Und MAI-Image-2 ist mit doppelter Generierungsgeschwindigkeit bereits in der Top-3-Familie auf dem Arena.ai-Leaderboard gelandet — Enterprise-Kunden wie die Agentur WPP setzen es bereits produktiv ein (→ KI Woche Analyse).
Strategisches Emanzipationssignal
Der Launch ist auch ein deutliches Zeichen unter der Führung von KI-Chef Mustafa Suleyman: Microsoft baut immer stärker eigene Modellfähigkeiten auf, statt sich ausschließlich auf die Partnerschaft mit OpenAI zu verlassen. Alle drei Modelle stammen komplett aus dem eigenen Microsoft-AI-Team. Zusammen mit der zunehmenden Integration von Anthropics Claude in Copilot entsteht das Bild eines Unternehmens, das seine Abhängigkeit gezielt diversifiziert.
🎯 Was das für die Praxis bedeutet
1. Transkription als Sofort-Gewinn: Wer regelmäßig Meetings, Interviews oder Kundengespräche verschriftlicht, findet mit MAI-Transcribe-1 eine schnelle und günstige Option — 0,36 Dollar pro Stunde sind deutlich unter vielen Wettbewerbern.
2. Stimmklonen wird trivial: Wenige Sekunden Audio reichen für eine glaubwürdige Stimmkopie. Das eröffnet enorme Möglichkeiten für Barrierefreiheit und Lokalisierung, erfordert aber klare interne Richtlinien gegen Missbrauch.
3. Enterprise-Bildgenerierung aus einer Hand: Unternehmen, die ohnehin im Microsoft-Ökosystem arbeiten, können mit MAI-Image-2 erstmals Bildgenerierung nutzen, ohne einen externen Anbieter anzubinden — inklusive Governance und Compliance über Foundry.