Im vierten von fünf Spielen hat Lee Sedol erstmals gegen AlphaGo gewonnen. Zwar spielte sie auch zuvor nicht fehlerlos, doch war dies der erste spielentscheidende Fehler des Programms.

In der Pressekonferenz nach dem Spiel sagte ein sichtlich gelöster Lee Sedol: “Hätte ich drei Spiele gewonnen und eins verloren, wäre ich jetzt sehr enttäuscht. Aber jetzt, nachdem ich drei Spiele in Folge verloren habe, würde ich diesen Sieg gegen nichts in der Welt eintauschen.”

Das hier ist mein Artikel zum gestrigen Spiel auf Golem.de. – Das Titelbild stammt aus der Liveübertragung der Pressekonferenz.

AlphaGo mit überlegener Eröffnung

AlphaGo begann das Spiel mit den schwarzen Steinen mit der gleichen Eröffnung wie das zweite Spiel. Erst im zwölften Zug wich Lee Sedol von der alten Sequenz ab und wählte ein anderes Eckabspiel, das AlphaGo zu einer anderen Reaktion zwang. Lee hatte daraufhin die Möglichkeit, die obere linke Ecke direkt anzugreifen.

Was danach folgte, war zunächst eine Demonstration der Überlegenheit durch AlphaGo. Das Programm baute sein Territorium an der oberen Seite des Bretts aus und erlangte zusätzlich starken Einfluss auf die gesamte Mitte des Bretts. Die weißen Steine Lee Sedols am oberen Rand waren praktisch tot, wie es auch die Kommentatoren bemerkten.

zug69

Eine ähnliche Situation hatte im dritten Spiel dazu geführt, dass Lee Sedol am Ende der Partie mit einer Reihe verzweifelter Züge versuchte, doch eine lebende Gruppe im Territorium des Gegners aufzubauen. Er scheiterte daran und entschuldigte sich nach der Partie für sein schlechtes Spiel, das überhaupt zu dieser Situation geführt hatte.

Ein guter Zug und ein schwerer Fehler entscheiden das Spiel

Als Lee Sedol in der heutigen Partie versuchte, das schwarze Territorium zumindest zu reduzieren, unterlief AlphaGo in einem komplexen Kampf offensichtlich eine Fehleinschätzung. Sie unterschätzte die Gefahr eines Klemmzuges (Zug 78), der zusammen mit dem Potenzial (dem “Aji”) von Schwächen in der Position der schwarzen Steine eine Sequenz ermöglichte, mit der Lee Sedol in das Territorium seines Gegners eindringen konnte. Es dauerte nach Angaben der Programmierer acht Züge, bis das Programm diesen Fehler bemerkte – da war es zu spät.

zug78

Der Zug wird bereits mit dem berühmten Zug im Rote-Ohren-Spiel aus dem 19. Jahrhundert verglichen, in dem der junge Honinbo Shusaku gegen Inoue Genan Inseki spielte und einem Beobachter bei einem Zug auffiel, dass Genan Insekis Ohren rot wurden, als er einen besonders guten Zug sah. Eine ähnliche Regung ist bei einem Computer leider nicht zu erwarten.

Michael Redmond sagte, er sei von dem Zug überrascht gewesen. Gu Li, einer der besten chinesischen Spieler, soll ihn einen “Zug Gottes” genannt haben. Aber im Livekommentar der American Go Association hatte die Profispielerin Lee Hajin den gleichen Zug gefunden, bevor er gespielt wurde. Im Video passiert dies im Kommentar nach einer Stunde und 26 Minuten.

In der Pressekonferenz meinte Lee Sedol zu dem Zug nur, dass es der einzige Zug gewesen sei, den er habe finden können, und er habe das Lob für den Zug nicht verdient. Er glaubt aber, eine Schwäche des Programms darin gefunden zu haben, dass es schlechter spiele, wenn es auf unerwartete Probleme stoße. Außerdem war er der Auffassung, dass AlphaGo mit schwarzen Steinen generell etwas schlechter spiele.

Anschließend zeigte AlphaGo die typische Reaktion von Computer-Go-Programmen, die deutlich im Rückstand sind: Sie spielen Züge, die einen schweren Fehler des Gegners erfordern würden, um zum Erfolg zu führen. Es dauerte aber bis zum Zug 180, bis AlphaGo seine Siegchancen schließlich als so schlecht einschätzte, dass sie aufgab.

zug180

Aja Huang, einer der Programmierer von Alpha Go, der auch die Steine für das Programm auf das Spielbrett legt, sagte: “Dafür sind wir hier. Wir wollen die Fehler im Programm finden und sie korrigieren, und dafür brauchen wir ein kreatives Genie wie Lee Sedol.”

Das letzte Spiel der Serie wird nach einem Ruhetag am Dienstag gespielt. Die gesamte Partie, mit dem offiziellen englischen Kommentar und der Pressekonferenz am Ende, kann inzwischen auf Youtube angesehen werden.

Kommentare (14)

  1. #1 schlappohr
    14. März 2016

    “Wir wollen die Fehler im Programm finden und sie korrigieren,”

    Das ist eine interessante Aussage. Ein Fehler führt dazu, dass AlphaGo eine Partie verliert. Sind alle Fehler beseitigt, so gewinnt AlphaGo immer. Das setzt jedoch voraus, dass es überhaupt einen absolut sicheren Weg gibt, jedes Spiel zu gewinnen. Gibt es diesen Weg? Wenn ja, was würde dann geschehen, wenn AlphaGo gegen AlphaGo antritt, also beide den “Trick” kennen? Gibt es diesen Königsweg jedoch nicht, so bleibt *immer* eine Möglichkeit, jede KI im Go zu besiegen.

    • #2 wasgeht
      14. März 2016

      Ich glaube es geht eher darum festzustellen, unter welchen Umständen die KI Fehler macht, wie es dazu kommt und wie man sie reduzieren kann.

      Im Prinzip ist das Problem hier, dass der Computer, genauso wie der Mensch, Prioritäten setzen muss bei dem, welche Zugfolgen er sich genauer anschaut. Hier war einfach eine wichtige Zugfolge nicht in die Prioritäten gerutscht.

  2. #3 Thilo
    14. März 2016

    Was heißt es denn, bei einem neuronalen Netzwerk den Fehler im Programm zu finden? Die trainieren sich doch eigentlich selbst und korrigieren auch selbst ihre Fehler.

    • #4 wasgeht
      14. März 2016

      Ich schätze, es geht um die Optimierung des Trainings und der Algorithmen mit denen das neuronale Netz aufgesetzt wird.

  3. #5 werner
    14. März 2016

    “Was heißt es denn, bei einem neuronalen Netzwerk den Fehler im Programm zu finden?”
    Vielleicht die Art und Weise zu überarbeiten, wie das Programm “dazulernt” ?

  4. #6 Chemiker
    14. März 2016

    @ #1 schlappohr

    Beim Go spielen zwei Spieler gegen­einander. Aber nicht aus sym­metri­scher Position: Einer hat den Anfangs­zug.

    Wenn es eine Gewinnstrategie gibt (was niemand weiß), dann kann sie nur für einen von beiden gelten. Würden also zwei perfekte Spieler gegen­einander antreten, dann würde ent­weder immer Schwarz oder immer Weiß ge­win­nen. Der jeweils andere müßte darauf ver­trauen, daß sein Gegner einen Fehler macht.

  5. #7 schlappohr
    14. März 2016

    Es sei denn, es gibt Situationen, in denen keiner der Spieler mehr einen Punkt machen kann und die Anzahl der Punkte bei beiden gleich ist. Keine Ahnung, ob so etwas prinzipiell möglich ist beim Go, aber wenn, dann müsste ein von beiden Seiten fehlerloses Spiel in eine solche Situation laufen.

    • #8 wasgeht
      14. März 2016

      Ja, im endspiel sind solche Situationen standard.

  6. #9 hugo
    14. März 2016

    @schlappohr:
    Im Go gibt es keinen Zufall, also existiert grundsätzlich eine perfekte Spielweise (oder sogar mehrere). Würden zwei perfekte Spieler gegeneinander spielen, würde entweder immer Schwarz oder immer Weiß gewinnen (oder sie würden immer unentschieden spielen, aber soweit ich weiß wird üblicherweise mit halbzahligem Komi gespielt, so dass keine Unentschieden möglich sind). Wäre diese perfekte Strategie bekannt (und realistisch spielbar), dann wäre Go ähnlich interessant wie Tic-Tac-Toe, wo bei perfekter Spielweise immer der Startspieler gewinnt. Allerdings ist Go so extrem viel komplexer, dass diese perfekte Lösung aller voraussicht nach nie gefunden werden wird.

  7. #10 Martin Windischer
    15. März 2016

    @hugo
    Prinzipiell stimme ich dir zu, allerdings gibt es bei Go je nach verwendetem Regelset auch noch die Möglichkeit, dass das Ganze in einem Triple-Ko oder Ähnlichem endet, was dann in einem “kein Ergebnis” resultiert.

    Je nach Präferenz (ist “kein Ergebnis” besser als ein Unentschieden?) und verwendeten Regeln (die in gewissen Fällen durchaus über Sieg oder Niederlage entscheiden können) kann die mathematisch “perfekte” Partie also ziemlich unterschiedlich aussehen.

    Und Tic-Tac-Toe endet bei perfekter Spielweise natürlich in einem Unentschieden.

  8. #11 Stefab
    15. März 2016

    Ich hatte es neulich schon unter einen AlphaGo-Artikel hier geschrieben: Verdammt gut gespielt oder “Züge, die ein Mensch nie machen würde”, das sei doch die Frage.

    Inzwischen habe ich – ich weiß nicht mehr, wo – gelesen, ein professioneller Go-Spieler hätte die Züge von AlphaGo mit “mein Go-Lehrer hätte mir auf die Finger geklopft, wenn ich das im Unterricht gespielt hätte”.

    Ist es also nicht vielmehr so, dass es in diesem Spiel “Konventionen” gibt, dass “man” es auf traditionelle Art spielt, und dass eben AlphaGo kein “man” ist, sondern ein Computerprogramm, dass sich um solche ungeschriebenen Gesetze nicht kümmert, sondern nur um die Regeln? Dass sich die menschlichen Spieler (soweit sie sich das Spiel nicht autodidaktisch beibringen) künstlich im “Raum” der erlaubten Züge einschränken? (Ein Zug muss nicht nur nach den Regeln erlaubt sein, er muss auch irgendwelchen Go-Traditionen entsprechen.)

  9. #14 Alderamin
    15. März 2016

    @stefab

    Ist es also nicht vielmehr so, dass es in diesem Spiel “Konventionen” gibt, dass “man” es auf traditionelle Art spielt, und dass eben AlphaGo kein “man” ist, sondern ein Computerprogramm, dass sich um solche ungeschriebenen Gesetze nicht kümmert, sondern nur um die Regeln?

    Wurde AlphaGo nicht mit einer großen Menge von historischen Partien trainiert und hätte es somit nicht die Konventionen automatisch mit lernen müssen?