Nie jesteś zalogowany | Zaloguj się

Prelegent(ci): Henryk Michalewski i Piotr Miłoś
Afiliacja: Instytut Matematyki
Termin: 15 listopada 2018 14:30
Pokój: p. 2180 (sala RW)
Tytuł w języku angielskim: Reinforcement learning, learning to win
Seminarium: Kolokwium Wydziału MIM UW

Uczenie ze wzmocnieniem może potencjalnie rozwiązać każdy problem decyzyjny. Pomimo, że cel ten jest wciąż daleki do osiągnięcia praktycznie, to w ostatnich latach byliśmy świadkami spektakularnych sukcesów. W wystąpieniu pokażemy jak wygrać w grę Atari, jak pokonać mistrza świata w Go, jak nauczyć się biegać i jak wykazać twierdzenie. Naszkicujemy algorytmy, które pozwoliły osiągnąć te sukcesy i opiszemy codzienne problemy badacza w tej dziedzinie.

Reinforcement learning brings a premise of solving virtually any decision problem. While this level of generality is still elusive in practice, recent years have brought spectacular progress. In the talk we will show how to learn to win in a vintage Atari game, how to beat a champion in Go, how to learn to run and how to prove a theorem. We will outline state-of-the art algorithms which led to this achievements and describe typical problems of RL researcher.

plakat

Uczenie ze wzmocnieniem, lekcja wygrywania

Kariera

Strona internetowa

Bezpieczeństwo na Kampusie