Stellt sich heraus, dass ich tatsächlich einfach nur DUMM bin. Hab bei Loose -1, bei Win 1 und bei Draw 2 als integer state representation benutzt. Je mehr desto besser, daher hat der Bot aktiv versucht ein Unentschieden zu erreichen... Bitte schlag mich nicht
Python:
-1 O # Alice
1 S O # Bob
-1 S OO # Alice
1 S S OO # Bob
-1 S S OOO # Alice
1 S SS OOO # Bob
-1 S SS OOOO # Alice
1 S SSS OOOO # Bob
-1 S SSS OOOOO # Alice
1 S SSSS OOOOO # Bob
-1 S SSSS OOOOOO # Alice
1 S SSSSSOOOOOO # Bob
-1 S OSSSSSOOOOOO # Alice
1 SSOSSSSSOOOOOO # Bob.