You are not logged in | Log in

O ulepszaniu algorytmów dla gier dwuosobowych z pełną informacją

Speaker(s)
Arkadiusz Paterek
Affiliation
Uniwersytet Warszawski
Date
Dec. 15, 2005, 12:15 p.m.
Room
room 5870
Seminar
Seminar Algorithms

Na seminarium omówię własne eksperymenty związane z zastosowaniem technik uczenia z nadzorem do wyboru parametrów funkcji oceniającej w programie grającym w szachy. Opowiem również o algorytmie BPIP, obiecującej alternatywie dla algorytmu alfa-beta cięć. Jest to algorytm typu best-first search, oparty na teorii decyzji. Funkcja oceniająca w algorytmie BPIP zwraca dla liści drzewa rozkład prawdopodobieństwa. Rozkłady są propagowane do korzenia drzewa przeszukiwania, zgodnie z regułą minimaksową. Przeszukiwanie polega na rozwijaniu liści, które mają największy wpływ na oczekiwaną wypłatę. Dodatkową zaletą algorytmu BPIP jest jasne kryterium zakończenia przeszukiwania.