Nie jesteś zalogowany | Zaloguj się

O ulepszaniu algorytmów dla gier dwuosobowych z pełną informacją

Prelegent(ci)
Arkadiusz Paterek
Afiliacja
Uniwersytet Warszawski
Termin
15 grudnia 2005 12:15
Pokój
p. 5870
Seminarium
Seminarium "Algorytmika"

Na seminarium omówię własne eksperymenty związane z zastosowaniem technik uczenia z nadzorem do wyboru parametrów funkcji oceniającej w programie grającym w szachy. Opowiem również o algorytmie BPIP, obiecującej alternatywie dla algorytmu alfa-beta cięć. Jest to algorytm typu best-first search, oparty na teorii decyzji. Funkcja oceniająca w algorytmie BPIP zwraca dla liści drzewa rozkład prawdopodobieństwa. Rozkłady są propagowane do korzenia drzewa przeszukiwania, zgodnie z regułą minimaksową. Przeszukiwanie polega na rozwijaniu liści, które mają największy wpływ na oczekiwaną wypłatę. Dodatkową zaletą algorytmu BPIP jest jasne kryterium zakończenia przeszukiwania.