O ulepszaniu algorytmów dla gier dwuosobowych z pełną informacją
- Prelegent(ci)
- Arkadiusz Paterek
- Afiliacja
- Uniwersytet Warszawski
- Termin
- 15 grudnia 2005 12:15
- Pokój
- p. 5870
- Seminarium
- Seminarium "Algorytmika"
Na seminarium omówię własne eksperymenty związane z zastosowaniem technik uczenia z nadzorem do wyboru parametrów funkcji oceniającej w programie grającym w szachy. Opowiem również o algorytmie BPIP, obiecującej alternatywie dla algorytmu alfa-beta cięć. Jest to algorytm typu best-first search, oparty na teorii decyzji. Funkcja oceniająca w algorytmie BPIP zwraca dla liści drzewa rozkład prawdopodobieństwa. Rozkłady są propagowane do korzenia drzewa przeszukiwania, zgodnie z regułą minimaksową. Przeszukiwanie polega na rozwijaniu liści, które mają największy wpływ na oczekiwaną wypłatę. Dodatkową zaletą algorytmu BPIP jest jasne kryterium zakończenia przeszukiwania.