Nie jesteś zalogowany | zaloguj się

Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego

  • Skala szarości
  • Wysoki kontrast
  • Negatyw
  • Podkreślenie linków
  • Reset

Aktualności — Wydarzenia

Sem. "Uczenie maszynowe"

 

All-Action Policy Gradients


Prelegent: Michal Nauman

2023-01-19 12:15

In this talk, we will discuss policy gradients with many action samples. We will investigate decompositions of policy gradient variance, as well as measure the variance reduction effect stemming form increasing the number of state and action samples used in estimation. Finally, we will compare various strategies of simulating additional samples using neural networks.