Optymalizacja procesów złożonych przy pomocy uczenia ze wzmocnieniem
- Speaker(s)
- dr Paweł Gora
- Affiliation
- Quantum AI Foundation & MIMUW
- Language of the talk
- Polish
- Date
- Dec. 20, 2024, 4 p.m.
- Room
- room 4060
- Link
- https://meet.google.com/jbj-tdsr-aop
- Seminar
- Seminar Intelligent Systems
Procesy złożone występują powszechnie w otaczającym nas świecie. Przejawiają się w wielu dziedzinach, takich jak przyroda, społeczeństwo, czy technologia. Z uwagi na ich cechy, m.in. wrażliwość na warunki początkowe i wpływ otoczenia, ich ewolucja bywa trudna do przewidzenia, trudno jest też nią sterować.
W ramach pracy doktorskiej zajmowałem się optymalizacją procesów złożonych głównie poprzez łączenie symulacji komputerowych, metod uczenia nadzorowanego i metaheurystyk. Podejście to dało bardzo dobre wyniki w przypadku optymalizacji ruchem drogowym poprzez sterowanie sygnalizacją świetlną oraz optymalizacji leczenia nowotworu poprzez dobór protokołów radioterapii.
Pewnym istotnym wyzwaniem pozostaje jednak adaptacja do nowych scenariuszy i zmieniających się warunków. W tym celu testuję obecnie wraz z zespołem TensorCell nowe podejścia, między innymi techniki uczenia ze wzmocnieniem. Przyniosły one niedawno bardzo dobre rezultaty, m.in. w zagadnieniu sterowania sygnalizacją świetlną pozwoliły pokonać (w badanym w środowisku symulacyjnym scenariuszu) stosowany od lat w praktyce inżynierskiej algorytm Webstera.