Künstliche Intelligenz und Schach: Erschreckend klug

Alpha Zero hat in nur vier Stunden Schach erlernt. Gegen die künstliche Intelligenz haben weder Menschen noch Schachprogramme die leiseste Chance.

auf einem Schachbrett steht eine weiße Dame, davor liegt ein schwarzer König

Wenn Alpha Zero Schwarz ist, wird das hier nie wieder passieren Foto: imago/Els

„Ich bin geschockt. Das ist ein neues, großes Ding, was Schach komplett ändert – es ist verrückt“, fasst US-Großmeister Wesley So seine Gefühlslage zusammen. Selbst beim Finale der Grand Chess Tour in London standen Weltmeister Magnus Carlsen & Co im Schatten einer Nachricht aus dem Hause Google: Das Programm Alpha Zero zertrümmerte als Debütant eines der drei weltweiten Topprogramme, „Stockfish“.

Schon alleine das Ergebnis von 28 Siegen und 72 Unentschieden – bei keiner einzigen Niederlage in 100 Partien! – hatte gereicht, um Begehrlichkeiten zu wecken. Der russische Vizeweltmeister Sergej Karjakin würde sofort 100.000 Dollar auf den Tisch legen, um als einziger Spieler „Zugriff auf Alpha Zero zu haben“.

Konkurrent Maxime Vachier-Lagrave hätte unbesehen „Siebenstelliges“ überwiesen, so der Franzose „das Geld hätte“. Schließlich reicht schon die Qualität von „Stockfish“, um Weltmeister Magnus Carlsen in einem zehnrundigen Wettkampf rein rechnerisch mit 9:1 auseinanderzunehmen. Gegen Alpha Zero hätte der Norweger, dem Platz drei in London zum Gesamtsieg bei der Grand Chess Tour knapp vor Vachier-Lagrave (beide 5:4 Punkte) reichte, noch geringere Aussichten auf ein Remis.

„Ich würde nicht einmal davon träumen, eine Partie gegen ,Stockfish' zu gewinnen“, gesteht der Weltranglistenfünfte aus Frankreich und zeigt sich „extrem beeindruckt“ von Alpha Zeros Überlegenheit. Doch nicht allein diese ist für Schachspieler erschreckend. Die Denkstrategen blicken zig Züge voraus und ahnen: Das Programm von Demis Hassabis lässt das von Menschen gespielte Schach doch sehr lächerlich aussehen. Denn Alpha Zero brachte sich das Schachspiel in nur vier Stunden anhand von Großmeister-Partien selbst bei und sammelte in der Zeitspanne mehr Erkenntnisse als der Mensch in den rund 1.500 Jahren des königlichen Spiels zuvor! Schachfans fühlen sich womöglich an den Film „Matrix“ erinnert und halten denkende Roboter für die Wachablösung.

Dabei sind es die Schachmeister bereits seit 20 Jahren gewohnt, dass Programme ihnen den Rang ablaufen. Damals hatte „Deep Blue“ von IBM Weltmeister Garri Kasparow in einem Wettkampf über sechs Partien knapp geschlagen. Angesichts der rasanten Entwicklung freundeten sich alle mit den Engines an und nutzen diese zur exzessiven Eröffnungsvorbereitung.

Was, wenn Alpha Zero länger als vier Stunden lernt?

Doch der Kantersieg über „Stockfish“ stellte noch einmal einen Quantensprung dar. „Ich war erstaunt“, räumt Fabiano Caruana, der das Londoner Turnier im Stichkampf vor dem Russen Ian Nepomniachtschi (beide 6) gewann, ein und überlegt, „was erst möglich ist, wenn Alpha Zero länger als vier Stunden lernt …“

Überraschend kommt die Entwicklung nicht. Im Mai hatte sich sein schlaues Brüderchen „Alpha Go Zero“ das noch komplexere Spiel Go in drei Tagen selbst beigebracht und den Weltranglistenersten Ki Jie mit 3:0 überfahren. Der 19-jährige Chinese war während des dritten Duells den Tränen nah, wurde kolportiert. Auch fünf Go-Asse konnten zusammen in einer Beratungspartie nichts gegen die Künstliche Intelligenz ausrichten. Beide selbstlernenden Programme stammen von Deep Mind, einem Forschungsinstitut für künstliche Intelligenz in London, das die Google-Konzernmutter Alphabet vor drei Jahren für angeblich fast eine halbe Milliarde Euro aufkaufte.

Hinter dem Projekt steckt mit Hassabin ein einstiges Schach-Wunderkind. Der griechischstämmige Londoner war mit 13 Jahren der beste Schachspieler seines Alters – hinter der Ungarin Judit Polgar, die später mit 15 Jahren den legendären Rekord des US-Genies Bobby Fischer als jüngster Großmeister brach. Hassabin entwickelte sich mit Deep Mind zu Googles Superhirn.

Monte-Carlo-Simulationen

Während Top-Schach-Engines etwa um die 70 Millionen Stellungen pro Sekunde bewerten, prüft „Alpha Zero“ mit rund 80.000 fast nur ein Promille – dafür aber die Richtigen. Schon Alpha Go Zero hatte auf sogenannte Monte-Carlo-Simulationen vertraut, obwohl diese für Würfelspiele wie Backgammon geeigneter erschienen. Hassabin brachte die Idee wieder zurück, nachdem Schachprogrammierer bis dato mehr auf die Brute-Force-Rechengewalt vertraut hatten.

„Stockfish“-Autor Tord Romstad glaubt, dass Alpha Zero mit einer längeren Vorbereitung seine Engine noch mehr überrollt hätte. Die Pleite erklärt der Programmierer aber auch damit, dass „Stockfish“ nicht auf die Bedenkzeit von einer Minute pro Zug optimiert sei – vor allem jedoch lief ein bereits ein Jahr alter „Stockfish“ auf einem handelsüblichen Computer, während sein Bezwinger sich auf aufgepeppte Hardware eines Konzerns, bei dem Geld keine Rolle spielt, habe stützen können. Deshalb findet Romstad, bei dem ungleichen Duell seien „Äpfel mit Orang-Utans verglichen worden“. Weil der norwegische Landsmann von Magnus Carlsen aber auch erwartet, dass Alpha Zero seine Kunst irgendwann auf einem normalen Rechner beweist, sehen Skeptiker ihre Zukunftsängste bestätigt.

Die Kommentarfunktion unter diesem Artikel ist geschlossen.

So können Sie kommentieren:

Bitte registrieren Sie sich und halten Sie sich an unsere Netiquette.

Haben Sie Probleme beim Kommentieren oder Registrieren?

Dann mailen Sie uns bitte an kommune@taz.de.

Leser*innenkommentare

hilda.b
17. 12. 2017, 00:46

"Denn Alpha Zero brachte sich das Schachspiel in nur vier Stunden anhand von Großmeister-Partien selbst bei [...]"

Falsch! Das entscheidende an Alpha Zero ist ja eben, dass es keine Großmeister Partien braucht, sondern in den vier Stunden ausschließlich gegen sich selbst spielt! Auf diese Weise startet der Algorithmus das Spiel ohne jegliche 'Vorurteile' durch menschliche Erfahrung zu lernen. Wer sich die Partien anschaut, wird merken, dass Alpha Zero sehr ungewöhnliche Spielzüge macht, die so noch nie gesehen wurden und sich als deutlich effektiver herausstellen als herkömmliche Spielstrategien.
hup
15. 12. 2017, 04:22

Das Problem bei KI-Lernen ist, dass auch die Programmierer die Muster nicht mehr deuten können. Kurz, man weiss nicht wirklich wie die hinterlegte, erlernte Intuition funktioniert. Sie funktioniert halt im Rahmen der Vorgaben ausreichend gut. Beim Schach ist das unproblematisch, aber bei komplexeren Echtzeit-Aufgaben wie Autofahren oder Zocken an der Börse könnte es leicht zu Missverständnissen kommen, die Rahmenbedingungen nicht ausreichend abgesichert sein. Und es ist klar, dass diese Maschinen kritische Aufgaben übernehmen werden, sobald sie für ihre Schöpfer wirtschaftliche Vorteile haben, man wird nicht warten bis man versteht was passiert - das würde die Vermarktung unter Konkurrenzdruck zu lange verzögern. Wir werden in Zukunft also mit omnipräsenten inselbegabten Blackboxen leben und denen kritische Aufgaben in Transport, Produktion und Wirtschaft anvertrauen. Bis es hinreichend kritisch kracht: viele Tote, Wirtschaftskrise, schwer und spät zu entdeckende Serienfehler in der Produktion. Und je später es kracht, desto integraler sind diese KIs bereits in unser Leben integriert.

Und das ist nur KI erster Generation (je nach Zählweise) - das ganze integral vernetzt, mit der simulation von Bewusstsein ausgestattet - das wird dann das echte Problem. „Abschalten“ scheitert nicht wie im Film an Gegenwehr der KI, sondern daran, dass sie so sehr in alle Abläufe integriert ist, dass das abschalten der KI einem abschalten der Wirtschaft, Kommunikation und aller Dienstleistungen gleichkommt weil wir nicht mehr wissen wie und warum genau die KIs Dinge entschieden haben - wir werden selbst immer inkompetenter, reine Konsumenten der KIs.

Mit KIs wird man vieles effizienter machen, aber im Kapitalismus nur zum Wohle weniger, während die optimierte Gesellschaft immer anfälliger für Krisen und damit riskanter wird - ohne KI ist diese Gesellschaft nicht mehr stabil zu regulieren - Die Fallhöhe wächst, die Folgen z.B. eines Solarsturms werden immer dramatischer.
- BigRed
  15. 12. 2017, 21:30
  @hup Für extreme Wirtschaftskrisen brauchen wir die KI aber nicht. :) Und HFT spielt sich eh schon ab.
Hartz
13. 12. 2017, 16:45
Perfektion kommt direkt aus der Hölle!
BigRed
13. 12. 2017, 16:15

Gott, geht mir der Hype auf die Nerven:

"Denn Alpha Zero brachte sich das Schachspiel in nur vier Stunden anhand von Großmeister-Partien selbst bei und sammelte in der Zeitspanne mehr Erkenntnisse als der Mensch in den rund 1.500 Jahren des königlichen Spiels zuvor! "

Angesichts davon, wie viel schneller der Rechner Züge verarbeiten kann, sind die 4h kein ernstzunehmendes Kriterium.

Und das grosse Problem der 1500 Jahre menschlichen Spiels ist eben, dass die dadurch gewonnenen Erkenntnisse nicht im Hirn eines einzigen Menschen gespeichert sind und ein Mensch nicht beliebig akkurat auf diese Informationen zugreifen kann.

Die Wertfunktion erlaubt es AlphaZero, für jede Situation in kurzer Zeit eine quantitative Bewertung jeder möglichen Aktion zu erhalten. Selbst ein Grossmeister, der Millionen Partien gespielt hätte, würde aufgrund der Unzulänglichkeit unsere "Hardware" zwangsweise Fehler bei ebendieser Bewertung machen.
minato
13. 12. 2017, 11:27

Wenn man sich jetzt noch überlegt, daß Alpha Zero nur gefühlt 3 Dollar 80 Entwicklungskosten hatte und qasi mit Spiele-Konsolen-Standardchip läuft. . Und jetzt jeder menschliche Honk mit 1x googlen in 14 Minuten automatisch auf Meisterniveau schachspielen instantartig erlernt und endlich all diesen arroganten Schachern eine Instagram-Nase zeigen kann... endlich, KI für alle und so billich und soo simbbel...

...Hoppla, stimmt ja gar nicht. Aber sonst --> subbah-dolle Meldung
Hartz
13. 12. 2017, 07:34

Hoffnung

Bald wird uns die künstliche Intelligenz regieren.

Politiker werden abgeschafft.

Das macht Hoffnung!

...
Picard
13. 12. 2017, 05:40
KI im Schachspiel gut, dabei sollte es auch bleiben. Wir haben soeben entdeckt, KI im Wirtschaftsleben und Kapitalismus ist der blanke Horror. Wir werden nicht umhin kommen, dem Trip KI einfach den Bereich künstliche Intelligenz zuzuweisen. Wie wir uns mit dem blanken Horror beschäftigen, eine Frage der Realität.
- BigRed
  13. 12. 2017, 16:09
  @Picard Wo sind denn ihre Beweise dafür dass KI in der kapitalischen Wirtschaft "der blanke Horror" sei?
  - Hampelstielz
    14. 12. 2017, 05:41
    @BigRed Der Mensch arbeitet an seiner Entmündigung und eventuell sogar Ausmerzung. Diesem Zustand strebt er im gesellschaftlichen Rahmen, durch all die Herrschaftsformen, ja schon immer zu. Etwas beunruhigend aber ist der Gedanke, dass eine KI sich irgendwann selbst weiter entwickelt, denn es kann niemand absehen, wohin die Reise dann geht. Wir leben in der Anfangszeit, ähnlich der Erforschung der Atomphysik. Damals dachte auch niemand daran, wie bald eine Möglichkeit zur Auslöschung der eigenen Existenz bestehen wird.
    - Marzipan
      14. 12. 2017, 18:11
      
      > Etwas beunruhigend aber ist der Gedanke, dass eine KI sich irgendwann selbst weiter entwickelt, denn es kann niemand absehen, wohin die Reise dann geht.
      
      So ist das eben mit der Evolution.
      
      Womöglich ist Homo sapiens gar nicht die Krone der Schöpfung, sondern nur ein sehr unzulängliche kohlenstoffbasierte Vorstufe für anderes, das von so nervenzerfetzenden Angelegenheiten wie Beziehungsgedöns oder der Frage nach dem Sinn des Lebens gar nicht tangiert wird.
  - Hampelstielz
    14. 12. 2017, 05:31
    @BigRed Ich denke, dass Picard Algorithmen zur Abwicklung des Devisenhandels meint. Ich kann jetzt ebenfalls keine Quelle nennen, aber da sind bekanntermaßen schon Fehler mit Tragweite entstanden. Vielleicht kann jemand anderes ein Fallbeispiel bringen.
    - Lowandorder
      15. 12. 2017, 00:03
      
      Nicht direkt!
      
      Aber es war John von Neumann -
      
      Der schon wg systemzwingender Fehler - davor warnte - (der mit Zopf;) Raketenabwehrsystem - Star War et al.
      
      Allein pc-gebased zu fahren!
      
      &
      
      Es war ein beherzter sowj. Genaral der
      
      "…die greifen uns nicht mit nur drei Interkontinentalraketen an!"
      
      Ende der 80er die nukleare Katastrophe verhinderte. Den
      
      (Übertragungsfehler via Lichtreflexe über Nebraska (?) hatten sich hochgerechnet!)
      
      Er wurde dennoch degradiert!
      
      Erst bei/post Gorbi - rehabilitiert!
      
      Näher dran war - offensichtlich nie!
Lowandorder
12. 12. 2017, 23:17

Faszinierend. Si'cher dat.

Aber - am Anfang ist die Intelligenz Fertigkeit Begabung Intuition etc des Programmierers & das ist nix - Künstliches.

Auch die Lernfähigkeit des "Aliens" ist - Produkt des - Programmierens.

Nothing else.

Genauso wie das Runterdestillieren auf die Spielversion.

kurz - Faszination - is ne feine Sache.

Nebel & Sand in die Augen - aber nicht!

Vllt. ist "Erschreckend schlau"

Das richtigere Fazit - ;))

(mit dem feinen Dialog - "Kaninchen ist schlau!" - "Hm - deswegen versteht es auch nix!" by Piglet & Winnie the Pooh.
- Rainer B.
  13. 12. 2017, 17:20
  
  Sie haben mich jetzt um meinen Beitrag gebracht. Mit anderen Worten hätte ich auch nichts anderes dazu geschrieben als Sie es getan haben.
  
  by the way:
  
  Wozu überhaupt noch Schach spielen, wenn der Gegner alle Züge schon kennt?
  
  Die tieferen Zusammenhänge zwischen Lernen und Spielen sind den allermeisten Menschen bis heute nicht klar und der „künstlichen Intelligenz“ wird es damit auch nicht anders ergehen können.
  - Lowandorder
    15. 12. 2017, 08:00
    
    Jau. "Der Mensch spielt nur, wo er in voller Bedeutung des Wortes Mensch ist, und er ist nur da ganz Mensch, wo er spielt."
    
    &
    
    Zum Friedrich Schiller https://de.m.wikipedia.org/wiki/Homo_ludens
    
    &
    
    Gerade dabei drei kids umme Ecke
    
    nicht Gitarrespielen 'beibringen' -
    
    Sondern entdecken lassen - wie frauman Gitarre spielt; bis einen irgendwann - Sternstunde - vllt
    
    die Musik spielt!;)
Marius
12. 12. 2017, 20:53
Ich check's nicht. Wie bringt sich Alpha Zero das Schachspielen selbst bei? Hat der ein Buch gelesen wie Johnny Nr. 5 und dann alle Varianten mal eben durchgerechnet?
- BigRed
  13. 12. 2017, 16:23
  
  Und was Mustardman da beschreibt, geht grundsätzlich für jede Situation, in der man Zustände beschreiben, und eine Menge diskrete Aktionen zur Auswahl stellen kann - entweder explizit oder mittels Regeln.
  
  Ob es sich nun um Schach handelt (oder Dame und Backgammon davor), Go, Sportarten wie Basketball oder Eishockey, oder die Steuerung eines Fahrzeugs ist relativ egal. Einige sind allerdings schwerer zu beschreiben, als andere.
  
  Zu guter Letzt muss man noch "Belohnungen" und "Verluste" für Endzustände festlegen.
  
  Und danach spielt die Maschine die Situation x-Mal durch und/oder betrachtet Beispiele der Handlungsweisen menschlicher Experten (Grossmeister oder einfach Autofahrer, die ohne Unfall irgendwo ankommen), und sieht, welche Aktionen Verluste minimieren und Belohnungen.
  
  Welcome to reinforcement learning (https://en.wikipedia.org/wiki/Reinforcement_learning).
- Mustardman
  12. 12. 2017, 21:44
  
  Alpha Zero bekommt die Regeln und spielt dann unzählige Partien gegen sich selbst, wobei es lernt, was funktioniert (zum Sieg führt) und was nicht funktioniert. Dafür muss es eben nicht alle möglichen Varianten durchrechnen, sondern nur die, die zu einem Sieg führen, und es gewinnt ja jedes Spiel und verliert auch jedes Spiel...
  
  Das Lernen passiert übrigens auf ganz erheblich leistungsfähigerer Hardware als die, die dann für das Spielen benutzt wird. Und was da läuft, ist dann eine Art kondensierte Erfahrung aus vielen Spielen. Das Ding rechnet nicht einfach alles durch, es kann wirklich gut spielen.
  
  Da steckt nicht einfach drin, was ein Mensch reinprogrammiert hat, es hat das Spielen selber gelernt und die Spielzüge sind teilweise ziemlich originell. "Alien" nannte es jemand.
  
  Solche lernenden Systeme sind schon eine faszinierende Entwicklung.
  - Grisch
    13. 12. 2017, 10:04
    
    Was Sie beschreiben ist kein kreativer Prozess sondern die Anwendung von auswendig gelernten, systematisch überprüften Vorgehensweisen.
    
    Was ist daran faszinierend wenn in dieser Disziplin eine Maschine mit mehr Rechenleistung gegen eine mit weniger Rechenleistung gewinnt? Ich als denkender Mensch würde das so erwarten.
    
    "Alleine" kann das Ding überhaupt nichts "lernen".
    - Velofisch
      13. 12. 2017, 14:56
      
      Das System lernt tatsächlich selbst. Es hat eine Vermutung wie es geht, probiert dies aus und optimiert an Hand des Ergebnisses. Von außen kommen nur die Schachregeln und ein gewisses Inventar an Spielerfahrung in Form gespielten Partien.
      
      Was Kreativität ist, ist eine andere Frage. Die systematische Optimierung ausgehend von einem zufälligen Ausgangszustand ist das wohl nicht.
      - BigRed
        13. 12. 2017, 21:37
        
        "Vermutung" ist ein zu starker Begriff. Gänzlich ohne Vorgabe (z.B. durch menschliche Partien) bestehen die ersten Durchläufe aus rein zufälligem Ausprobieren.
        
        Gerade die Fähigkeit des Menschen, aus Handlungsweisen in anderen Situationen Vermutungen abzuleiten und auf eine neue Situation zu transferieren, kriegen wir im maschinellen Lernen noch nicht so richtig hin.
        
        Transfer learning (https://en.wikipedia.org/wiki/Transfer_learning) ist ein sehr aktives Forschungsgebiet.
  - Lowandorder
    13. 12. 2017, 00:03
    
    But. HAL - 2001 Odyssee im Weltraum by
    
    Stanley Kubrick - is a movie - kerr!
    
    &
    
    "Schon Alan Turing und John von Neumann arbeiteten mit und an der Monte Carlo-Simulation.
    
    Gute Programmierung indeeed.";) https://de.m.wikipedia.org/wiki/Monte-Carlo-Simulation
Lowandorder
12. 12. 2017, 20:43

Ooch nö! & A Gähn!!!

&

Zum Mitschreiben!

There's no KI - nothing like that! & The rest is a lie!

(& the whole thing - a fine trick of money-fundraising!

Heinz von Foerster et al.!;))((

&

(Very effectiv! Yes - that's! - true! Have a look up above here!

(& here & here & now ~> you're pissing in your shoes!())

& Yes.

Das ist gute - Programmierung - stupid!

Nothing else!

& Ja!

Ende der Durchsage!

&

Ok. Let's have another round of bouce!;))

Künstliche Intelligenz und Schach: Erschreckend klug

Was, wenn Alpha Zero länger als vier Stunden lernt?

Monte-Carlo-Simulationen

Hartmut Metz

„Deepfakes“ – gefälschte Videos

Hat er das gerade wirklich gesagt?

Junges Talent gewinnt bei Schachturnier

Wie ein 13-Jähriger Geschichte schreibt

Unsere Online-Videos des Jahres 2017

Christian Lindner lernt Wrestling

hilda.b

hup

BigRed

Hartz

BigRed

minato

Hartz

Picard

BigRed

Hampelstielz

Marzipan

Hampelstielz

Lowandorder

Lowandorder

Rainer B.

Lowandorder

Marius

BigRed

Mustardman

Grisch

Velofisch

BigRed

Lowandorder

Lowandorder

Tabakkonsum einschränken

Finger weg von meiner Kippe

Milliardäre zahlen in der Schweiz mehr

Deutschland verschont Superreiche

29-Euro-Ticket

Gibt Berlin bayerisches Geld aus?

Kriminalisierung von Flucht

37 Minuten im Gericht, 46 Jahre Knast

Harte Strafen für Cannabis-Verstöße

Keine liberale Großstadt