Modele mieszanin Gaussowskich i odległość Wassersteina w zagadnieniu porównywania dużych zbiorów danych
- Prelegent(ci)
- Mateusz Przyborowski
- Afiliacja
- MIMUW
- Termin
- 10 grudnia 2021 14:15
- Informacje na temat wydarzenia
- online https://meet.google.com/jbj-tdsr-aop
- Seminarium
- Seminarium badawcze „Systemy Inteligentne”
Modele mieszanin Gaussowskich (Gaussian Mixture Models, GMM) można uznawać za uogólnienie algorytmu k-średnich; pozwalają one na przybliżenie rozkładu danych za pomocą kilku normalnych rozkładów prawdopodobieństwa oraz na szacowanie prawdopodobieństwa, z jakim każda obserwacja pochodzi z danego rozkładu. GMM jest więc swoistym podsumowaniem tego, jak poszczególne obserwacje rozkładają się w ramach zbioru danych, a porównywanie GMM-ów można potraktować jak przybliżone porównywanie pewnych istotnych cech wyjściowych zbiorów.
Odległość Wassersteina (również znana jako earth mover's distance) między dwoma rozkładami prawdopodobieństwa intuicyjnie odwzorowuje ilość pracy, którą należy wykonać w celu przekształcenia jednego rozkładu w drugi. Analityczne sformułowanie odległości Wassersteina nie daje się uogólnić do GMM-ów, jednakże pewne jej przybliżenie można sformułować i rozwiązać w postaci problemu optymalizacji liniowej.
Podczas mojego referatu pragnę opisać wyniki prac dot. zastosowań modeli mieszanin Gaussowskich wraz z odległością Wassersteina w problemie tworzenia i porównywania podsumowań dużych zbiorów danych.
----------------------------------------
Starting November 18 all seminars are on-line only at https://meet.google.com/jbj-tdsr-aop
Od 18 listopada spotkania seminarium odbywają się wyłącznie online pod adresem https://meet.google.com/jbj-tdsr-aop
---------------------------------------
Plan wystąpień w tej edycji jest dostępny tutaj
The schedule of presentations can be checked here