Meilensteine

AlphaGo

AlphaGo ist das KI-System, das 2016 die Welt elektrisierte: ein Computerprogramm, das den amtierenden Go-Weltmeister Lee Sedol in einem offiziellen Fünf-Spiele-Match 4:1 besiegte. Experten hatten diesen Meilenstein frühestens für 2025 erwartet.

Go galt als die letzte Bastion menschlicher Überlegenheit über Computer. Das Spiel hat mehr mögliche Stellungen als Atome im Universum (ca. 10^170), was Brute-Force-Suche unmöglich macht. Schach-Computer wie Deep Blue konnten Millionen Züge vorausberechnen — bei Go funktioniert das nicht. Stattdessen verlassen sich menschliche Spieler auf Intuition und Mustererkennung.

DeepMinds Lösung kombinierte zwei Ansätze. Ein tiefes neuronales Netz (Policy Network), trainiert auf Millionen menschlicher Partien, lernte, vielversprechende Züge zu identifizieren. Ein zweites Netz (Value Network) bewertete Stellungen. Beide wurden dann durch Self-Play verbessert — das System spielte Millionen Partien gegen sich selbst.

Zug 37 im zweiten Spiel gegen Lee Sedol ging als Wendepunkt in die KI-Geschichte ein: ein Zug, den kein menschlicher Spieler so gespielt hätte, den die Kommentatoren zunächst als Fehler einordneten — der sich aber als brillant erwies.

Der Nachfolger AlphaGo Zero (2017) ging noch weiter: Er lernte Go ohne jedes menschliche Wissen, rein durch Self-Play — und übertraf AlphaGo innerhalb von drei Tagen. AlphaZero verallgemeinerte das Prinzip auf Schach und Shogi.

History RL

AlphaGo

Verwandte Begriffe

Fehler melden

Die KI Woche als App