Uczenie ze wzmocnieniem, lekcja wygrywania
- Prelegent(ci)
- Henryk Michalewski i Piotr Miłoś
- Afiliacja
- Instytut Matematyki
- Termin
- 15 listopada 2018 14:30
- Pokój
- p. 2180
- Tytuł w języku angielskim
- Reinforcement learning, learning to win
- Seminarium
- Kolokwium Wydziału MIM UW
Uczenie ze wzmocnieniem może potencjalnie rozwiązać każdy problem decyzyjny. Pomimo, że cel ten jest wciąż daleki do osiągnięcia praktycznie, to w ostatnich latach byliśmy świadkami spektakularnych sukcesów. W wystąpieniu pokażemy jak wygrać w grę Atari, jak pokonać mistrza świata w Go, jak nauczyć się biegać i jak wykazać twierdzenie. Naszkicujemy algorytmy, które pozwoliły osiągnąć te sukcesy i opiszemy codzienne problemy badacza w tej dziedzinie.
Reinforcement learning brings a premise of solving virtually any decision problem. While this level of generality is still elusive in practice, recent years have brought spectacular progress. In the talk we will show how to learn to win in a vintage Atari game, how to beat a champion in Go, how to learn to run and how to prove a theorem. We will outline state-of-the art algorithms which led to this achievements and describe typical problems of RL researcher.