Nie jesteś zalogowany | Zaloguj się

Uczenie ze wzmocnieniem, lekcja wygrywania

Prelegent(ci)
Henryk Michalewski i Piotr Miłoś
Afiliacja
Instytut Matematyki
Termin
15 listopada 2018 14:30
Pokój
p. 2180
Seminarium
Kolokwium Wydziału MIM UW

Uczenie ze wzmocnieniem może potencjalnie rozwiązać każdy problem decyzyjny. Pomimo, że cel ten jest wciąż daleki do osiągnięcia praktycznie, to w ostatnich latach byliśmy świadkami spektakularnych sukcesów. W wystąpieniu pokażemy jak wygrać w grę Atari, jak pokonać mistrza świata w Go, jak nauczyć się biegać i jak wykazać twierdzenie. Naszkicujemy algorytmy, które pozwoliły osiągnąć te sukcesy i opiszemy codzienne problemy badacza w tej dziedzinie. 
 
Reinforcement learning brings a premise of solving virtually any decision problem. While this level of generality is still elusive in practice, recent years have brought spectacular progress. In the talk we will show how to learn to win in a vintage Atari game, how to beat a champion in Go,  how to learn to run and how to prove a theorem. We will outline state-of-the art algorithms which led to this achievements and describe typical problems of RL researcher.