Aproksymacja otoczki Markowa
- Speaker(s)
- Paweł Betliński
- Date
- Jan. 14, 2011, 2:15 p.m.
- Room
- room 5820
- Seminar
- Research Seminar of the Logic Group: Approximate reasoning in data mining
Referat będzie poświęcony istotnemu pojęciu w dziedzinie sieci
bayesowskich i nie tylko - otoczce Markowa (ang. Markov blanket, w
języku polskim najczęściej spotykane jest bezpośrednie tłumaczenie:
koc Markowa). Dla wektora zmiennych losowych A, a w praktyce dla A -
zbioru atrybutów systemu informacyjnego, otoczka Markowa zmiennej X
należącej do A to minimalny podzbiór M zbioru A \ {X} taki, że X jest
niezależne od (A \ {X}) \ M pod warunkiem M. Pojęcie to zostało
zaproponowane w 1988 roku, ale dopiero w ostatniej dekadzie nastąpił
istotny rozwój metod aproksymacji otoczki Markowa. Przygniatająca
większość powstałych metod należy do typu Constraint-Based Approach,
tzn. opiera się na testach statystycznych badających warunkową
niezależność atrybutów. Docelowo będę chciał przedstawić propozycję
nowej metody, która leży poza tym głównym nurtem, ale czerpie
inspiracje z algorytmu do niego należącego: IAMB (Incremental
Association Markov Blanket). Metoda IAMB, o której szerzej będzie mowa
na seminarium, jest modyfikacją wcześniejszej metody Grow-Shrink
polegającą na dodaniu sprytnej heurystyki. Pozwala ona w praktyce
zmniejszyć liczbę koniecznych do przeprowadzenia testów
statystycznych. Moje podejście całkowicie eliminuje konieczność użycia
testów, starając się w zamian szerzej wykorzystać zastosowaną w IAMB
heurystykę i pewne jej interesujące właściwości. Potencjalne skutki
tej modyfikacji zilustruję na przykładzie wstępnych eksperymentów
porównujących zaproponowaną metodę z kilkoma znanymi podejściami.