Menü
Wolfsburger Allgemeine / Aller-Zeitung| Ihre Zeitung aus Wolfsburg Wolfsburger Allgemeine / Aller-Zeitung| Ihre Zeitung aus Wolfsburg
Anmelden
Netzwelt AlphaZero: Googles neueste KI gewinnt Schach, Go und Shogi
Nachrichten Medien Netzwelt AlphaZero: Googles neueste KI gewinnt Schach, Go und Shogi
Partner im Redaktionsnetzwerk Deutschland
20:00 06.12.2018
AlphaZero schlägt alle: Das Computerprogramm meistert Schach, Go und Shogi. Quelle: DeepMind Technologies Ltd/dpa
London

AlphaZero schickt sich an, Meister aller Klassen zu werden. Das Computerprogramm hat die bislang besten digitalen Versionen für die Spiele Schach, Go und Shogi (eine japanische Schachvariante) geschlagen. Dabei hat es stets die gleiche Softwarearchitektur und dieselben Algorithmen verwendet. Garri Kasparow, langjähriger Schachweltmeister, ist vom Schachspiel des neuen Meisterprogramms angetan: „Ich kann meine Zufriedenheit nicht verbergen, dass es mit einem sehr dynamischen Stil spielt, ähnlich meinem eigenen“, wird er in einer Mitteilung zitiert.

AlphaZero stammt aus der Londoner Softwareschmiede DeepMind, das mit AlphaGo das erste Computerprogramm entwickelt hat, das menschliche Spieler im traditionellen chinesischen Brettspiel Go geschlagen hat. Im März 2016 siegte AlphaGo gegen den Südkoreaner Lee Sedol, einen der weltbesten Go-Spieler, in fünf Partien viermal. AlphaGo hatte von menschlichen Spielern gelernt, indem es eine riesige Anzahl an zurückliegenden Go-Spielen als Datenquelle erhielt. Im vergangenen Jahr gingen die Entwickler von AlphaGo einen Schritt weiter: Das neue Programm AlphaGo Zero lernte Go nur anhand der Spielregeln und durch Spiele gegen sich selbst.

AlphaZero braucht kein Spezialwissen mehr

Dieses Prinzip findet sich auch im Programm AlphaZero, das eine Gruppe um David Silver von DeepMind jetzt im Wissenschaftsmagazin „Science“ vorstellt. Die Forscher haben AlphaGo Zero so verändert, dass es auch Schach und Shogi auf meisterhafte Weise beherrscht. Bisher beinhaltete die künstliche Intelligenz (KI) jeweils zahlreiche Elemente, die ganz auf die Eigenheiten des einzelnen Spiels zugeschnitten waren. AlphaZero kommt ohne dieses Spezialwissen über die Spiele aus und kann nach nur wenigen Stunden Training die besten spezialisierten Programme besiegen.

Rechenmaschinen Schach spielen zu lassen, war bereits das Ziel einiger Computerpioniere: „Charles Babbage, Alan Turing, Claude Shannon und John von Neumann entwickelten Hardware, Algorithmen und Theorie, um Schach zu analysieren und zu spielen“, schreiben Silver und Kollegen. 1997 gewann dann erstmals Maschine gegen Mensch: Der von IBM entwickelte Schachcomputer Deep Blue schlug den damaligen Schachweltmeister Garri Kasparow in einem Wettkampf unter Turnierbedingungen 3,5 zu 2,5.

AlphaZero besiegte Stockfish nach nur vier Stunden Training

Während Kasparow damals noch unlauteren Wettbewerb durch menschliche Eingriffe ins Computerprogramm witterte, sieht er mittlerweile die Maschine als Inspirationsquelle an: „Diese autodidaktischen Expertenmaschinen erbringen nicht nur eine hervorragende Leistung, sondern wir können tatsächlich von dem neuen Wissen lernen, das sie hervorbringen.“ Ähnlich sieht es auch die internationale Schachmeisterin der Frauen, Natasha Regan: „Nachdem ich viele Monate damit verbracht hatte, die Schachspiele von AlphaZero zu erkunden, habe ich das Gefühl, dass meine Vorstellung von und mein Verständnis für das Spiels verändert und bereichert wurden.“

Das Team um Silver ließ AlphaZero im Schach gegen das Programm Stockfish antreten, derzeitiger Champion der „Top Chess Engine Championship“. Die meisten Partien endeten unentschieden, ähnlich wie bei der menschlichen Schachweltmeisterschaft zwischen den Spielern Magnus Carlsen und Fabiano Caruana. Insgesamt aber siegte AlphaZero häufiger als Stockfish, und das nach nur vier Stunden Training.

AlphaZero kann auch Go und Shoqi

Nur zwei Stunden lang musste AlphaZero die japanische Schachvariante Shogi gegen sich selbst spielen, um das Programm Elmo schlagen zu können. Elmo seinerseits hatte erst im vergangenen Jahr einen menschlichen Shogi-Meister besiegt. Bei Go spielte AlphaZero gegen den eigenen Vorläufer AlphaGo Lee und war ihm nach 30 Stunden Training überlegen.

Die Basis für diesen Erfolg sind sehr umfangreiche künstliche neuronale Netze als Architektur und ein Suchalgorithmus namens Monte Carlo tree search. Dieser geht nicht sämtliche Möglichkeiten zukünftiger Spielsituationen durch, sondern nur die wahrscheinlichsten. Hinzu kommt bei AlphaZero ein Lernalgorithmus nach dem Prinzip des bestärkenden Lernens (Reinforcement Learning). „Dieser Algorithmus nutzt ein ähnliches Prinzip wie das menschliche Gehirn“, sagt Torsten Kröger, der am Karlsruher Institut für Technologie (KIT) zu intelligenter Prozessautomation und Robotik forscht.

Erster Schritt zur universellen Lernmaschine

Viele Fortschritte auf dem Gebiet der künstlichen Intelligenz in jüngster Zeit hätten sich durch die Anwendung von bestärkendem Lernen ergeben, hebt Kröger hervor. So sei die Verbesserung von Technologien des US-Unternehmens Waymo für das autonome Fahren auf diese Lernstrategie zurückzuführen. „Deshalb ist es schade, dass Reinforcement Learning bei der KI-Strategie der Bundesregierung nur am Rande eine Rolle spielt“, bedauert Kröger.

Klaus-Robert Müller von der Technischen Universität Berlin ist beeindruckt, „dass nur ein Typus Reinforcement-Lernalgorithmus alle diese komplexen Strategiespiele im Selbstspiel hervorragend meistert.“ Dies sei ein wichtiger erster Schritt hin zu einer universellen strategischen Lernmaschine. Er schränkt zugleich ein: „Wichtig ist mir auch zu betonen, dass alle der untersuchten Spiele jedoch immer ein kontrolliertes Umfeld darstellen.“

Fähigkeiten von AlphaZero nicht wirklich auf reales Leben übertragbar

Das sieht Murray Campbell vom T.J. Watson Research Center in Yorktown Heights (New York, USA) in einem „Science“-Kommentar ganz ähnlich: „Schach, Shogi und Go sind sehr komplex, weisen jedoch eine Reihe von Eigenschaften auf, die sie für KI-Systeme erleichtern.“ Unter anderem gebe es nur zwei Spieler und für beide lägen alle Informationen über die Spielsituation offen; dies sei etwa beim Poker nicht der Fall. Die nächsten Herausforderungen für KI-Systeme könnten Multiplayer-Videospiele sein, die sehr große Zustandsräume und Aktionssätze hätten.

Aus gleichem Grund schränkt Christian Bauckhage vom Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme in Sankt Augustin den erreichten Fortschritt ein. Die Übertragbarkeit der Fähigkeiten von Programmen wie AlphaZero auf Szenarien außerhalb der Spielewelt sei schwierig, denn: „In welcher Situation in der echten Welt kennen wir schon alle Regeln?“

KI – ein Gebiet mit Mehrwert

Forschungsleiter Silver gibt genau dieses Übertragen als Ziel künftiger Entwicklungen an: „Mein Traum ist es zu sehen, dass das gleiche System nicht nur für Brettspiele gilt, sondern für alle Arten realer Anwendungen – zum Beispiel für Medikamentenentwurf, Materialdesign oder Biotechnologie.“

Auch Torsten Kröger vom KIT ist vom Potenzial der künstlichen Intelligenz überzeugt: „In den kommenden zwei Jahrzehnten wird KI dasjenige Gebiet sein, auf dem der größte Mehrwert entstehen wird.“ Er hat intelligente Maschinen im Blick, die Produktionszeiten und Materialverbrauch beständig optimieren – und zwar während der Betriebszeit.

Einsatz in Fabriken und Landwirtschaft

Solche Roboter könnten in Fabriken, aber auch in der Landwirtschaft eingesetzt werden. Zudem verspricht sich Kröger bessere Vorhersagen an den Finanzmärkten durch den verstärkten Einsatz künstlicher Intelligenz. Noch aber diese nur aufgrund ihrer enormen Rechenleistung überlegen. „Die Systeme brauchen noch enorm viele Daten, um so gut zu lernen wie ein Mensch“, sagt Kröger.

Als vor zweieinhalb Jahren AlphaGo den südkoreanischen Go-Champion Lee Sedol schlug, hieß es in einem Bericht, die südkoreanische Go-Spielgemeinschaft sei schockiert gewesen. Seitdem hat sich die Wahrnehmung grundlegend geändert. Der Japaner Yoshiharu Habu, der bis heute als einziger Spieler alle sieben Grand-Slam-Titel im Shogi gewann, sagt etwa über AlphaZero: „Sein einzigartiger Spielstil zeigt uns, dass es für Shogi neue Möglichkeiten gibt.“ So habe AlphaZero den König in die Mitte des Brettes gesetzt, was gegen die gegenwärtige Shogi-Theorie sei.

Die spektakuläre Niederlage Sedols gegen AlphaGo hat für die menschlichen Go-Spieler, zumindest in Deutschland, auch einen positiven Effekt gehabt: „Es gab einen Riesenboom“, sagte Michael Marz, Präsident des Deutschen Go-Bundes, bereits vor einem Jahr. Die Nachfrage nach Büchern und anderem Go-Material sei deutlich gestiegen.

Von RND/dpa

Wann startet Fortnite Season 7, wie sehen die neuen Skins aus und was gibt es in der neuen Staffel sonst noch an Updates? Hier fassen wir alle aktuellen Neuigkeiten zusammen.

06.12.2018

Der Deutsche Entwicklerpreis gilt als einer der wichtigsten Preise der Computerspiel-Branche in Deutschland. Als bestes Spiel wurde in diesem Jahr eine postapokalyptische Reise ausgezeichnet. „Bestes Studio“ wurde ein Team aus Berlin.

06.12.2018

Irgendwann erwischt es jeden. Jedes Jahr zu Weihnachten schallt „Last Christmas“ aus den Radios dieser Welt. Eine Internet-Challenge sucht den längsten Last-Christmas-„Überlebenden“.

06.12.2018