Reinforcement learning, learning to win
- Speaker(s)
- Henryk Michalewski i Piotr Miłoś
- Affiliation
- Instytut Matematyki
- Date
- Nov. 15, 2018, 2:30 p.m.
- Room
- room 2180
- Title in Polish
- Uczenie ze wzmocnieniem, lekcja wygrywania
- Seminar
- Colloquium Of MIM
Uczenie ze wzmocnieniem może potencjalnie rozwiązać każdy problem decyzyjny. Pomimo, że cel ten jest wciąż daleki do osiągnięcia praktycznie, to w ostatnich latach byliśmy świadkami spektakularnych sukcesów. W wystąpieniu pokażemy jak wygrać w grę Atari, jak pokonać mistrza świata w Go, jak nauczyć się biegać i jak wykazać twierdzenie. Naszkicujemy algorytmy, które pozwoliły osiągnąć te sukcesy i opiszemy codzienne problemy badacza w tej dziedzinie.
Reinforcement learning brings a premise of solving virtually any decision problem. While this level of generality is still elusive in practice, recent years have brought spectacular progress. In the talk we will show how to learn to win in a vintage Atari game, how to beat a champion in Go, how to learn to run and how to prove a theorem. We will outline state-of-the art algorithms which led to this achievements and describe typical problems of RL researcher.