AlphaGo ist nicht unbesiegbar

Im vierten von fünf Spielen hat Lee Sedol erstmals gegen AlphaGo gewonnen. Zwar spielte sie auch zuvor nicht fehlerlos, doch war dies der erste spielentscheidende Fehler des Programms.

In der Pressekonferenz nach dem Spiel sagte ein sichtlich gelöster Lee Sedol: “Hätte ich drei Spiele gewonnen und eins verloren, wäre ich jetzt sehr enttäuscht. Aber jetzt, nachdem ich drei Spiele in Folge verloren habe, würde ich diesen Sieg gegen nichts in der Welt eintauschen.”

Das hier ist mein Artikel zum gestrigen Spiel auf Golem.de. – Das Titelbild stammt aus der Liveübertragung der Pressekonferenz.

AlphaGo mit überlegener Eröffnung

AlphaGo begann das Spiel mit den schwarzen Steinen mit der gleichen Eröffnung wie das zweite Spiel. Erst im zwölften Zug wich Lee Sedol von der alten Sequenz ab und wählte ein anderes Eckabspiel, das AlphaGo zu einer anderen Reaktion zwang. Lee hatte daraufhin die Möglichkeit, die obere linke Ecke direkt anzugreifen.

Was danach folgte, war zunächst eine Demonstration der Überlegenheit durch AlphaGo. Das Programm baute sein Territorium an der oberen Seite des Bretts aus und erlangte zusätzlich starken Einfluss auf die gesamte Mitte des Bretts. Die weißen Steine Lee Sedols am oberen Rand waren praktisch tot, wie es auch die Kommentatoren bemerkten.

Eine ähnliche Situation hatte im dritten Spiel dazu geführt, dass Lee Sedol am Ende der Partie mit einer Reihe verzweifelter Züge versuchte, doch eine lebende Gruppe im Territorium des Gegners aufzubauen. Er scheiterte daran und entschuldigte sich nach der Partie für sein schlechtes Spiel, das überhaupt zu dieser Situation geführt hatte.

Ein guter Zug und ein schwerer Fehler entscheiden das Spiel

Als Lee Sedol in der heutigen Partie versuchte, das schwarze Territorium zumindest zu reduzieren, unterlief AlphaGo in einem komplexen Kampf offensichtlich eine Fehleinschätzung. Sie unterschätzte die Gefahr eines Klemmzuges (Zug 78), der zusammen mit dem Potenzial (dem “Aji”) von Schwächen in der Position der schwarzen Steine eine Sequenz ermöglichte, mit der Lee Sedol in das Territorium seines Gegners eindringen konnte. Es dauerte nach Angaben der Programmierer acht Züge, bis das Programm diesen Fehler bemerkte – da war es zu spät.

Der Zug wird bereits mit dem berühmten Zug im Rote-Ohren-Spiel aus dem 19. Jahrhundert verglichen, in dem der junge Honinbo Shusaku gegen Inoue Genan Inseki spielte und einem Beobachter bei einem Zug auffiel, dass Genan Insekis Ohren rot wurden, als er einen besonders guten Zug sah. Eine ähnliche Regung ist bei einem Computer leider nicht zu erwarten.

Michael Redmond sagte, er sei von dem Zug überrascht gewesen. Gu Li, einer der besten chinesischen Spieler, soll ihn einen “Zug Gottes” genannt haben. Aber im Livekommentar der American Go Association hatte die Profispielerin Lee Hajin den gleichen Zug gefunden, bevor er gespielt wurde. Im Video passiert dies im Kommentar nach einer Stunde und 26 Minuten.

In der Pressekonferenz meinte Lee Sedol zu dem Zug nur, dass es der einzige Zug gewesen sei, den er habe finden können, und er habe das Lob für den Zug nicht verdient. Er glaubt aber, eine Schwäche des Programms darin gefunden zu haben, dass es schlechter spiele, wenn es auf unerwartete Probleme stoße. Außerdem war er der Auffassung, dass AlphaGo mit schwarzen Steinen generell etwas schlechter spiele.

Anschließend zeigte AlphaGo die typische Reaktion von Computer-Go-Programmen, die deutlich im Rückstand sind: Sie spielen Züge, die einen schweren Fehler des Gegners erfordern würden, um zum Erfolg zu führen. Es dauerte aber bis zum Zug 180, bis AlphaGo seine Siegchancen schließlich als so schlecht einschätzte, dass sie aufgab.

Aja Huang, einer der Programmierer von Alpha Go, der auch die Steine für das Programm auf das Spielbrett legt, sagte: “Dafür sind wir hier. Wir wollen die Fehler im Programm finden und sie korrigieren, und dafür brauchen wir ein kreatives Genie wie Lee Sedol.”

Seite 1 / 2 / Auf einer Seite lesen

Nächste Seite »

Kommentare (14)

#1 schlappohr
14. März 2016

“Wir wollen die Fehler im Programm finden und sie korrigieren,”

Das ist eine interessante Aussage. Ein Fehler führt dazu, dass AlphaGo eine Partie verliert. Sind alle Fehler beseitigt, so gewinnt AlphaGo immer. Das setzt jedoch voraus, dass es überhaupt einen absolut sicheren Weg gibt, jedes Spiel zu gewinnen. Gibt es diesen Weg? Wenn ja, was würde dann geschehen, wenn AlphaGo gegen AlphaGo antritt, also beide den “Trick” kennen? Gibt es diesen Königsweg jedoch nicht, so bleibt *immer* eine Möglichkeit, jede KI im Go zu besiegen.
- #2 wasgeht
  14. März 2016
  
  Ich glaube es geht eher darum festzustellen, unter welchen Umständen die KI Fehler macht, wie es dazu kommt und wie man sie reduzieren kann.
  
  Im Prinzip ist das Problem hier, dass der Computer, genauso wie der Mensch, Prioritäten setzen muss bei dem, welche Zugfolgen er sich genauer anschaut. Hier war einfach eine wichtige Zugfolge nicht in die Prioritäten gerutscht.
#3 Thilo
14. März 2016

Was heißt es denn, bei einem neuronalen Netzwerk den Fehler im Programm zu finden? Die trainieren sich doch eigentlich selbst und korrigieren auch selbst ihre Fehler.
- #4 wasgeht
  14. März 2016
  
  Ich schätze, es geht um die Optimierung des Trainings und der Algorithmen mit denen das neuronale Netz aufgesetzt wird.
#5 werner
14. März 2016

“Was heißt es denn, bei einem neuronalen Netzwerk den Fehler im Programm zu finden?”
Vielleicht die Art und Weise zu überarbeiten, wie das Programm “dazulernt” ?
#6 Chemiker
14. März 2016

@ #1 schlappohr

Beim Go spielen zwei Spieler gegeneinander. Aber nicht aus symmetrischer Position: Einer hat den Anfangszug.

Wenn es eine Gewinnstrategie gibt (was niemand weiß), dann kann sie nur für einen von beiden gelten. Würden also zwei perfekte Spieler gegeneinander antreten, dann würde entweder immer Schwarz oder immer Weiß gewinnen. Der jeweils andere müßte darauf vertrauen, daß sein Gegner einen Fehler macht.
#7 schlappohr
14. März 2016

Es sei denn, es gibt Situationen, in denen keiner der Spieler mehr einen Punkt machen kann und die Anzahl der Punkte bei beiden gleich ist. Keine Ahnung, ob so etwas prinzipiell möglich ist beim Go, aber wenn, dann müsste ein von beiden Seiten fehlerloses Spiel in eine solche Situation laufen.
- #8 wasgeht
  14. März 2016
  
  Ja, im endspiel sind solche Situationen standard.
#9 hugo
14. März 2016

@schlappohr:
Im Go gibt es keinen Zufall, also existiert grundsätzlich eine perfekte Spielweise (oder sogar mehrere). Würden zwei perfekte Spieler gegeneinander spielen, würde entweder immer Schwarz oder immer Weiß gewinnen (oder sie würden immer unentschieden spielen, aber soweit ich weiß wird üblicherweise mit halbzahligem Komi gespielt, so dass keine Unentschieden möglich sind). Wäre diese perfekte Strategie bekannt (und realistisch spielbar), dann wäre Go ähnlich interessant wie Tic-Tac-Toe, wo bei perfekter Spielweise immer der Startspieler gewinnt. Allerdings ist Go so extrem viel komplexer, dass diese perfekte Lösung aller voraussicht nach nie gefunden werden wird.
#10 Martin Windischer
15. März 2016

@hugo
Prinzipiell stimme ich dir zu, allerdings gibt es bei Go je nach verwendetem Regelset auch noch die Möglichkeit, dass das Ganze in einem Triple-Ko oder Ähnlichem endet, was dann in einem “kein Ergebnis” resultiert.

Je nach Präferenz (ist “kein Ergebnis” besser als ein Unentschieden?) und verwendeten Regeln (die in gewissen Fällen durchaus über Sieg oder Niederlage entscheiden können) kann die mathematisch “perfekte” Partie also ziemlich unterschiedlich aussehen.

Und Tic-Tac-Toe endet bei perfekter Spielweise natürlich in einem Unentschieden.
#11 Stefab
15. März 2016

Ich hatte es neulich schon unter einen AlphaGo-Artikel hier geschrieben: Verdammt gut gespielt oder “Züge, die ein Mensch nie machen würde”, das sei doch die Frage.

Inzwischen habe ich – ich weiß nicht mehr, wo – gelesen, ein professioneller Go-Spieler hätte die Züge von AlphaGo mit “mein Go-Lehrer hätte mir auf die Finger geklopft, wenn ich das im Unterricht gespielt hätte”.

Ist es also nicht vielmehr so, dass es in diesem Spiel “Konventionen” gibt, dass “man” es auf traditionelle Art spielt, und dass eben AlphaGo kein “man” ist, sondern ein Computerprogramm, dass sich um solche ungeschriebenen Gesetze nicht kümmert, sondern nur um die Regeln? Dass sich die menschlichen Spieler (soweit sie sich das Spiel nicht autodidaktisch beibringen) künstlich im “Raum” der erlaubten Züge einschränken? (Ein Zug muss nicht nur nach den Regeln erlaubt sein, er muss auch irgendwelchen Go-Traditionen entsprechen.)
- #12 wasgeht
  15. März 2016
  
  Ja. Steht so auch gerade in einem Artikel, der demnächst online geht und morgen hier erscheint.
- #13 wasgeht
  15. März 2016
  
  Ganz abgesehen davon habe ich ja schonmal über die diversen Traditionen und die Geschichte in der Eröffnungstheorie geschrieben: https://scienceblogs.de/wasgeht/2015/10/30/die-entwicklung-des-go-spiels-in-der-japanischen-geschichte/
#14 Alderamin
15. März 2016

@stefab

Ist es also nicht vielmehr so, dass es in diesem Spiel “Konventionen” gibt, dass “man” es auf traditionelle Art spielt, und dass eben AlphaGo kein “man” ist, sondern ein Computerprogramm, dass sich um solche ungeschriebenen Gesetze nicht kümmert, sondern nur um die Regeln?

Wurde AlphaGo nicht mit einer großen Menge von historischen Partien trainiert und hätte es somit nicht die Konventionen automatisch mit lernen müssen?

Was geht? (Und was nicht?) Um diese beiden Fragen soll es hier gehen. Und wenn sie schon nicht beantwortet werden, dann soll zumindest mit ihnen gekämpft werden. Die letzten drei Jahrhunderte Entwicklung in der Technik haben so manchen staunend zurück gelassen. Der britische Autor Arthur C. Clarke hat diese Erfahrung in drei "Gesetzen" formuliert. Das berühmteste ist sicher das letzte:

"Any sufficiently advanced technology is indistinguishable from magic."
Jede ausreichend fortgeschrittene Technologie ist von Magie nicht zu unterscheiden.

Und tatsächlich lässt sich heute in so manchen Diskussionen das Wort Technik ohne weiteres durch Magie ersetzen. Zu oft werden ihr unbegrenzte Fähigkeiten zugesprochen. Dem ist nicht so und ich hoffe mit dem Blog einen kleinen Beitrag zur Aufklärung beizutragen.

Auf Facebook kann man das Blog jetzt übrigens auch finden.

Wem das Blog gefällt, dem sei gesagt, dass ich dafür kaum bezahlt werde und trotzdem Geld für meinen Lebensunterhalt brauche.

Wer den Blog unterstützen will, kann das über Paypal.me machen. Das funktioniert für alle innerhalb der EU ohne Gebühren. Entweder ihr wählt dort selbst einen Betrag aus, oder nehmt die Links für 5€, 10€ oder 20€.

Juni 2015: 30 Euro.
Juli 2015: 30 Euro.
August 2015: 70 Euro.
September 2015: 10 Euro.
Oktober 2015: 40 Euro.
November 2015: 30 Euro.
Dezember 2015: 20 Euro.
Februar 2016: 20 Euro.

Bitte teilt mir mit, ob ich eure Namen veröffentlich darf.

Vielen Dank an alle Spender!

Wer mir monatlich Geld zukommen lassen will, hat dazu die Möglichkeit auf Patreon.

Vielen Dank an Thorben und Bazille!

Frank Wunderlich-Pfeiffer hat die erste Milliarde Sekunden seines Lebens schon hinter sich, ist Wirtschaftsingenieur und hat in Jena Physik studiert. Er interessiert sich für alles mögliche, zur Zeit gerade besonders intensiv Trägerraketen und Kernkraft, aber eigentlich alle Bereiche der Energieversorgung, Technik, Naturwissenschaften allgemein und der Wirtschaft, zuletzt auch immer mehr Geschichte und Gesellschaftswissenschaften. Emails bitte an: Frank.Wunderlich.Pfeiffer@gmail.com (Die Funktioniert jetzt wirklich. Ich hatte hier viel zu lange Zeit eine ".de" adresse stehen, die ins Leere ging. Sorry. Bitte schreibt nochmal!)

Wie kam Nordkorea an die Bombe – und was Zeit Online daraus machte

Es begab sich, dass Zeit Online einen Artikel über das Atombombenprogramm von Nordkorea haben wollte. Ich…
DNA als Datenspeicher wird langsam realistischer

Wollen wir es nicht übertreiben, das Verfahren ist noch lange nicht konkurrenzfähig. Einige hundert Kilobyte auszulesen…
Thermophotovoltaik – wenn die echte Sonne nicht gut genug ist

Bei der Suche nach effizienteren Wegen, Strom aus Sonnenlicht zu erzeugen, ist das natürliche Sonnenlicht das…
Starshot: Leibnitzkeks am Sonnensegel – Podcast und Artikel

Taufrisch aus den Schneidhallen des riesigen Podcastimperiums von Christopher kommt Ausgabe 34 vom Countdown Podcast, unter…
Falcon 9 Landung und Countdown Podcast (Ausgabe 33)

Die letzten beiden Ausgaben vom Countdown Podcast – unter anderem mit einem Livekommentar zur ersten Landung…

AlphaGo ist nicht unbesiegbar

AlphaGo mit überlegener Eröffnung

Ein guter Zug und ein schwerer Fehler entscheiden das Spiel

Kommentare (14)

Über das Blog

Countdown Podcast

Über den Autor

Neueste Beiträge

Wie kam Nordkorea an die Bombe – und was Zeit Online daraus machte

DNA als Datenspeicher wird langsam realistischer

Thermophotovoltaik – wenn die echte Sonne nicht gut genug ist

Starshot: Leibnitzkeks am Sonnensegel – Podcast und Artikel

Falcon 9 Landung und Countdown Podcast (Ausgabe 33)

Archive

Kategorien

Meta

Letzte Kommentare

Lesezeichen

AlphaGo ist nicht unbesiegbar

AlphaGo mit überlegener Eröffnung

Ein guter Zug und ein schwerer Fehler entscheiden das Spiel

Kommentare (14)

Abonnieren

Über das Blog

Countdown Podcast

Über den Autor

Neueste Beiträge

Wie kam Nordkorea an die Bombe – und was Zeit Online daraus machte

DNA als Datenspeicher wird langsam realistischer

Thermophotovoltaik – wenn die echte Sonne nicht gut genug ist

Starshot: Leibnitzkeks am Sonnensegel – Podcast und Artikel

Falcon 9 Landung und Countdown Podcast (Ausgabe 33)

Archive

Kategorien

Meta

Letzte Kommentare

Lesezeichen