Microsoft hat drei hauseigene KI-Modelle vorgestellt, die allesamt auf Spitzenpositionen in ihren Disziplinen zielen — und dabei kein einziges Mal OpenAI erwähnen. MAI-Transcribe-1 für Sprache-zu-Text, MAI-Voice-1 für Stimmgenerierung und MAI-Image-2 für Bildproduktion stehen ab sofort über Microsoft Foundry zur Verfügung (Microsoft AI).

Weltbeste Transkription, natürliche Stimmen, konkurrenzfähige Bilder

MAI-Transcribe-1 ist laut FLEURS-Benchmark das genaueste Transkriptionsmodell der Welt — in 11 von 25 unterstützten Sprachen auf Platz 1. Dabei arbeitet es 2,5-mal schneller als Microsofts bisheriges Azure-Fast-Angebot und startet bei 0,36 Dollar pro Stunde. MAI-Voice-1 generiert aus wenigen Sekunden Audiomaterial individuell klingende Stimmen und produziert 60 Sekunden Sprache in einer einzigen Sekunde. Und MAI-Image-2 ist mit doppelter Generierungsgeschwindigkeit bereits in der Top-3-Familie auf dem Arena.ai-Leaderboard gelandet — Enterprise-Kunden wie die Agentur WPP setzen es bereits produktiv ein (→ KI Woche Analyse).

Strategisches Emanzipationssignal

Der Launch ist auch ein deutliches Zeichen unter der Führung von KI-Chef Mustafa Suleyman: Microsoft baut immer stärker eigene Modellfähigkeiten auf, statt sich ausschließlich auf die Partnerschaft mit OpenAI zu verlassen. Alle drei Modelle stammen komplett aus dem eigenen Microsoft-AI-Team. Zusammen mit der zunehmenden Integration von Anthropics Claude in Copilot entsteht das Bild eines Unternehmens, das seine Abhängigkeit gezielt diversifiziert.

🎯 Was das für die Praxis bedeutet

1. Transkription als Sofort-Gewinn: Wer regelmäßig Meetings, Interviews oder Kundengespräche verschriftlicht, findet mit MAI-Transcribe-1 eine schnelle und günstige Option — 0,36 Dollar pro Stunde sind deutlich unter vielen Wettbewerbern.

2. Stimmklonen wird trivial: Wenige Sekunden Audio reichen für eine glaubwürdige Stimmkopie. Das eröffnet enorme Möglichkeiten für Barrierefreiheit und Lokalisierung, erfordert aber klare interne Richtlinien gegen Missbrauch.

3. Enterprise-Bildgenerierung aus einer Hand: Unternehmen, die ohnehin im Microsoft-Ökosystem arbeiten, können mit MAI-Image-2 erstmals Bildgenerierung nutzen, ohne einen externen Anbieter anzubinden — inklusive Governance und Compliance über Foundry.

Dieser Artikel enthält eingebettete Inhalte Dritter (z. B. Videos, Social-Media-Beiträge). kiwoche.com berichtet über diese Inhalte, macht sie sich jedoch nicht zu eigen. Die Rechte und die Verantwortung liegen beim jeweiligen Urheber bzw. Plattformbetreiber.

📰 Quellen
Microsoft AI ↗ @mustafasuleyman auf X ↗
Teilen: