You are not logged in | Log in

Reinforcement learning, learning to win

Speaker(s)
Henryk Michalewski i Piotr Miłoś
Affiliation
Instytut Matematyki
Date
Nov. 15, 2018, 2:30 p.m.
Room
room 2180
Seminar
Colloquium Of MIM

Uczenie ze wzmocnieniem może potencjalnie rozwiązać każdy problem decyzyjny. Pomimo, że cel ten jest wciąż daleki do osiągnięcia praktycznie, to w ostatnich latach byliśmy świadkami spektakularnych sukcesów. W wystąpieniu pokażemy jak wygrać w grę Atari, jak pokonać mistrza świata w Go, jak nauczyć się biegać i jak wykazać twierdzenie. Naszkicujemy algorytmy, które pozwoliły osiągnąć te sukcesy i opiszemy codzienne problemy badacza w tej dziedzinie. 
 
Reinforcement learning brings a premise of solving virtually any decision problem. While this level of generality is still elusive in practice, recent years have brought spectacular progress. In the talk we will show how to learn to win in a vintage Atari game, how to beat a champion in Go,  how to learn to run and how to prove a theorem. We will outline state-of-the art algorithms which led to this achievements and describe typical problems of RL researcher.