Künstliche Intelligenz und Schach: Erschreckend klug

Alpha Zero hat in nur vier Stunden Schach erlernt. Gegen die künstliche Intelligenz haben weder Menschen noch Schachprogramme die leiseste Chance.

auf einem Schachbrett steht eine weiße Dame, davor liegt ein schwarzer König

Wenn Alpha Zero Schwarz ist, wird das hier nie wieder passieren Foto: imago/Els

„Ich bin geschockt. Das ist ein neues, großes Ding, was Schach komplett ändert – es ist verrückt“, fasst US-Großmeister Wesley So seine Gefühlslage zusammen. Selbst beim Finale der Grand Chess Tour in London standen Weltmeister Magnus Carlsen & Co im Schatten einer Nachricht aus dem Hause Google: Das Programm Alpha Zero zertrümmerte als Debütant eines der drei weltweiten Topprogramme, „Stockfish“.

Schon alleine das Ergebnis von 28 Siegen und 72 Unentschieden – bei keiner einzigen Niederlage in 100 Partien! – hatte gereicht, um Begehrlichkeiten zu wecken. Der russische Vizeweltmeister Sergej Karjakin würde sofort 100.000 Dollar auf den Tisch legen, um als einziger Spieler „Zugriff auf Alpha Zero zu haben“.

Konkurrent Maxime Vachier-Lagrave hätte unbesehen „Siebenstelliges“ überwiesen, so der Franzose „das Geld hätte“. Schließlich reicht schon die Qualität von „Stockfish“, um Weltmeister Magnus Carlsen in einem zehnrundigen Wettkampf rein rechnerisch mit 9:1 auseinanderzunehmen. Gegen Alpha Zero hätte der Norweger, dem Platz drei in London zum Gesamtsieg bei der Grand Chess Tour knapp vor Vachier-Lagrave (beide 5:4 Punkte) reichte, noch geringere Aussichten auf ein Remis.

„Ich würde nicht einmal davon träumen, eine Partie gegen ,Stockfish' zu gewinnen“, gesteht der Weltranglistenfünfte aus Frankreich und zeigt sich „extrem beeindruckt“ von Alpha Zeros Überlegenheit. Doch nicht allein diese ist für Schachspieler erschreckend. Die Denkstrategen blicken zig Züge voraus und ahnen: Das Programm von Demis Hassabis lässt das von Menschen gespielte Schach doch sehr lächerlich aussehen. Denn Alpha Zero brachte sich das Schachspiel in nur vier Stunden anhand von Großmeister-Partien selbst bei und sammelte in der Zeitspanne mehr Erkenntnisse als der Mensch in den rund 1.500 Jahren des königlichen Spiels zuvor! Schachfans fühlen sich womöglich an den Film „Matrix“ erinnert und halten denkende Roboter für die Wachablösung.

Dabei sind es die Schachmeister bereits seit 20 Jahren gewohnt, dass Programme ihnen den Rang ablaufen. Damals hatte „Deep Blue“ von IBM Weltmeister Garri Kasparow in einem Wettkampf über sechs Partien knapp geschlagen. Angesichts der rasanten Entwicklung freundeten sich alle mit den Engines an und nutzen diese zur exzessiven Eröffnungsvorbereitung.

Was, wenn Alpha Zero länger als vier Stunden lernt?

Doch der Kantersieg über „Stockfish“ stellte noch einmal einen Quantensprung dar. „Ich war erstaunt“, räumt Fabiano Caruana, der das Londoner Turnier im Stichkampf vor dem Russen Ian Nepomniachtschi (beide 6) gewann, ein und überlegt, „was erst möglich ist, wenn Alpha Zero länger als vier Stunden lernt …“

Überraschend kommt die Entwicklung nicht. Im Mai hatte sich sein schlaues Brüderchen „Alpha Go Zero“ das noch komplexere Spiel Go in drei Tagen selbst beigebracht und den Weltranglistenersten Ki Jie mit 3:0 überfahren. Der 19-jährige Chinese war während des dritten Duells den Tränen nah, wurde kolportiert. Auch fünf Go-Asse konnten zusammen in einer Beratungspartie nichts gegen die Künstliche Intelligenz ausrichten. Beide selbstlernenden Programme stammen von Deep Mind, einem Forschungsinstitut für künstliche Intelligenz in London, das die Google-Konzernmutter Alphabet vor drei Jahren für angeblich fast eine halbe Milliarde Euro aufkaufte.

Hinter dem Projekt steckt mit Hassabin ein einstiges Schach-Wunderkind. Der griechischstämmige Londoner war mit 13 Jahren der beste Schachspieler seines Alters – hinter der Ungarin Judit Polgar, die später mit 15 Jahren den legendären Rekord des US-Genies Bobby Fischer als jüngster Großmeister brach. Hassabin entwickelte sich mit Deep Mind zu Googles Superhirn.

Monte-Carlo-Simulationen

Während Top-Schach-Engines etwa um die 70 Millionen Stellungen pro Sekunde bewerten, prüft „Alpha Zero“ mit rund 80.000 fast nur ein Promille – dafür aber die Richtigen. Schon Alpha Go Zero hatte auf sogenannte Monte-Carlo-Simulationen vertraut, obwohl diese für Würfelspiele wie Backgammon geeigneter erschienen. Hassabin brachte die Idee wieder zurück, nachdem Schachprogrammierer bis dato mehr auf die Brute-Force-Rechengewalt vertraut hatten.

„Stockfish“-Autor Tord Romstad glaubt, dass Alpha Zero mit einer längeren Vorbereitung seine Engine noch mehr überrollt hätte. Die Pleite erklärt der Programmierer aber auch damit, dass „Stockfish“ nicht auf die Bedenkzeit von einer Minute pro Zug optimiert sei – vor allem jedoch lief ein bereits ein Jahr alter „Stockfish“ auf einem handelsüblichen Computer, während sein Bezwinger sich auf aufgepeppte Hardware eines Konzerns, bei dem Geld keine Rolle spielt, habe stützen können. Deshalb findet Romstad, bei dem ungleichen Duell seien „Äpfel mit Orang-Utans verglichen worden“. Weil der norwegische Landsmann von Magnus Carlsen aber auch erwartet, dass Alpha Zero seine Kunst irgendwann auf einem normalen Rechner beweist, sehen Skeptiker ihre Zukunftsängste bestätigt.

Einmal zahlen
.

Fehler auf taz.de entdeckt?

Wir freuen uns über eine Mail an fehlerhinweis@taz.de!

Inhaltliches Feedback?

Gerne als Leser*innenkommentar unter dem Text auf taz.de oder über das Kontaktformular.

Bitte registrieren Sie sich und halten Sie sich an unsere Netiquette.

Haben Sie Probleme beim Kommentieren oder Registrieren?

Dann mailen Sie uns bitte an kommune@taz.de.