Susann Janetzki ist eine spielebegeisterte Forscherin. Die 19-Jährige programmierte eine künstliche Intelligenz für das Würfelspiel Qwixx. Mit Erfolg: Janetzki wurde mit ihrem Projekt bei „Jugend forscht 2021“ Landessiegerin in Mecklenburg-Vorpommern im Fachgebiet Mathematik/Informatik.
Schach, Go, Shogi: In zahlreichen Brettspielen sind Computer uns Menschen schon lange überlegen. Das gilt neuerdings auch für Qwixx. Die künstliche Intelligenz (KI) Alpha-Qwixx von Janetzki erreicht bis zu 170 Punkte pro Partie. Menschen schaffen das kaum. Anders als bei Schach, Go oder Shogi kann bei Qwixx mit jedem Zug ein Gewinn oder eine Strafe (im Sinne der Fehlwürfe) ermittelt werden. „Das macht es für eine KI einfacher zu lernen, welche Züge gut sind“, sagt Janetzki.
Mit evolutionärem Algorithmus zum Ziel
Alpha-Qwixx entstand durch einen evolutionären Algorithmus. Das heißt: Innerhalb der Software traten mehrere KI-Spieler mit individuellen Strategien gegeneinander an. In einem mehrstufigen Prozess, der den Darwin‘schen Regeln von Mutation und Selektion folgte, schälte sich nach und nach der leistungsfähigste KI-Spieler heraus. „Die KI-Spieler bestanden aus zwei bis drei Vektoren mit jeweils vier Strategie-Werten. Am Anfang der Evolution, also in der ersten Generation, wurden die Strategie-Werte zufällig generiert“, erklärt Janetzki. Wenn ein KI-Spieler an der Reihe war, wendete er seine Strategie nacheinander auf jeden möglichen nächsten Zug an. Jede mögliche Situation wurde durch einen Situations-Vektor mit neun Werten ausgedrückt, der den gesamten Spielzettel beschreibt.
Die Vektoren wurden multipliziert beziehungsweise addiert und die Summe aller ihrer Werte aus dem resultierenden Vektor berechnet. Je höher die errechnete Zahl, desto besser der Zug. Entsprechend der tatsächlichen Qualität ihrer Strategien ergab sich nach mehreren Spielen eine Reihenfolge unter allen KI-Spielern. Manche waren besser, manche schlechter. Die KI-Spieler am unteren Ende der Rangliste wurden aussortiert. Die KI-Spieler an der Spitze wurden Eltern. Das heißt, ihre Strategien wurden rekombiniert. Ziel der Rekombination war es, gute Eigenschaften zweier Eltern auf ein Kind zu übertragen. Dadurch entstanden Kinder, deren Strategie dem Durchschnitt der Strategien ihrer Eltern entsprach. „Auch Mutationen konnten auftreten und Werte in den Strategien jedes KI-Spielers zufällig ändern. Durch diese Evolutionsprozesse entstanden neue Strategien, die von Zeit zu Zeit tendenziell besser wurden“, sagt Janetzki. Am Ende der Evolution stand Alpha-Qwixx.
Alpha-Qwixx setzt auf viele Kreuze und lange Spiele
Alpha-Qwixx setzt auf lange Spiele. Das heißt, die KI versucht aus den Würfelergebnissen möglichst viele Punkte herauszuholen anstatt mit wenigen Punkten schnell das Spiel zu beenden. Die KI will außerdem grundsätzlich pro Reihe möglichst viele Kreuze setzten, während sie möglichst weit links bleibt, also Lücken klein hält. „Ist der Spielblock relativ leer, geht Alpha-Qwixx etwa ab Lücken, die drei Felder groß wären, Fehlwürfe ein. Ist das Spiel weiter fortgeschritten, lässt sich das nicht mehr so pauschal sagen und die Risikobereitschaft von Alpha-Qwixx ist situationsabhängig“, sagt Janetzki.
Ihrer Meinung nach können Menschen die Alpha-Qwixx-Strategie kopieren und auf einem identischen Niveau spielen. „Alpha-Qwixx trifft Entscheidungen immer nach dem gleichen Muster. Jede dieser Entscheidung kann durch Nachrechnen herausgefunden werden. Da die Alpha-Qwixx-Strategie nicht viele Werte hat, ist sie sehr überschaubar. Daher ist es relativ einfach, hypothetische Züge mit diesem Berechnungsschema zu bewerten.“
Code darf verändert werden
Entstanden ist Alpha-Qwixx mit Python. „Die Programmiersprache hat unter anderem den Vorteil, dass sie objektorientiert, modern und gut leserlich ist und zudem im Bereich des maschinellen Lernens eine der häufigsten genutzten Programmiersprache ist“, sagt Janetzki. Den Code ihres Projektes hat sie unter github.com/sjanetzki/qwixx-trainer veröffentlicht. Jede oder jeder kann daran weiterarbeiten oder den Code als Grundlage für neue Projekte verwenden.
Übrigens: Der Einsatz mit der Qwixx-KI ist nicht der erste Auftritt von Janetzki bei einem Wettbewerb. Bereits als Viertklässlerin nahm die Forscherin an „Schüler experimentieren“ teil. Damals, 2013, gewann sie im Fachgebiet Physik den ersten Preis mit einem Spiegel, in dem man sich nicht spiegelverkehr sieht.
Qwixx: Mehr als ein Lückenfüller
Manchmal sind es kleine Dinge, die großen Spaß machen. So wie das Würfelspiel Qwixx. Die Schachtel misst 13 mal 10 Zentimeter und ist damit nur knapp größer als ein Reclam-Heftchen. Wer sie öffnet, entdeckt darin einen Block und sechs Würfel. Mehr braucht Spieleautor Steffen Benndorf nicht für sein großartiges Spiel. Die Regeln sind schnell verinnerlicht. Wir kreuzen in vier bunten Reihen Zahlen an. In der roten und gelben Reihe sind die Zahlen in aufsteigender Reihenfolge angeordnet, von zwei bis zwölf. In der grünen und blauen Reihe in absteigender Reihenfolge, von zwölf bis zwei. Wir dürfen eine Zahl nur ankreuzen, wenn in der Reihe rechts von dieser Zahl noch kein Kreuz ist. Wir wandern mit unsern Kreuzen sozusagen von links nach rechts. Je mehr Kreuze in einer Reihe, desto mehr Siegpunkte. Doch nicht immer fallen die Würfel und damit die Zahlen so wie wir es uns wünschen. Was tun? Mut zur Lücke beweisen und nach der blauen Zehn, die Neun und Acht überspringen, um die blaue Sieben anzukreuzen? Über solche Fragen grübeln alle am Tisch. Jede und jeder ist ständig involviert. „Risiko eingehen oder vorsichtig agieren? Die kurzweilige Mischung aus Glück und Taktik hat das Potenzial, ein Dauerbrenner zu werden – zumal es in jedes Reisegepäck passt“, schreibt die Jury des Spiel des Jahres. Die Fachjournalisten haben Qwixx als „Spiel des Jahres 2013“ nominiert. Auch wenn das kleine Qwixx am Ende nicht den Titel gewann, hatte es zu Recht seinen großen Auftritt auf der Preisverleihung.