Nie jesteś zalogowany | Zaloguj się

Modele mieszanin Gaussowskich i odległość Wassersteina w zagadnieniu porównywania dużych zbiorów danych

Prelegent(ci)
Mateusz Przyborowski
Afiliacja
MIMUW
Termin
10 grudnia 2021 14:15
Informacje na temat wydarzenia
online https://meet.google.com/jbj-tdsr-aop
Seminarium
Seminarium badawcze „Systemy Inteligentne”

Modele mieszanin Gaussowskich (Gaussian Mixture Models, GMM) można uznawać za uogólnienie algorytmu k-średnich; pozwalają one na przybliżenie rozkładu danych za pomocą kilku normalnych rozkładów prawdopodobieństwa oraz na szacowanie prawdopodobieństwa, z jakim każda obserwacja pochodzi z danego rozkładu. GMM jest więc swoistym podsumowaniem tego, jak poszczególne obserwacje rozkładają się w ramach zbioru danych, a porównywanie GMM-ów można potraktować jak przybliżone porównywanie pewnych istotnych cech wyjściowych zbiorów.

Odległość Wassersteina (również znana jako earth mover's distance) między dwoma rozkładami prawdopodobieństwa intuicyjnie odwzorowuje ilość pracy, którą należy wykonać w celu przekształcenia jednego rozkładu w drugi. Analityczne sformułowanie odległości Wassersteina nie daje się uogólnić do GMM-ów, jednakże pewne jej przybliżenie można sformułować i rozwiązać w postaci problemu optymalizacji liniowej.

Podczas mojego referatu pragnę opisać wyniki prac dot. zastosowań modeli mieszanin Gaussowskich wraz z odległością Wassersteina w problemie tworzenia i porównywania podsumowań dużych zbiorów danych.

----------------------------------------

Starting November 18 all seminars are on-line only at https://meet.google.com/jbj-tdsr-aop

Od 18 listopada spotkania seminarium odbywają się wyłącznie online pod adresem https://meet.google.com/jbj-tdsr-aop

---------------------------------------

Plan wystąpień w tej edycji jest dostępny tutaj

The schedule of presentations can be checked here