Biredukty i biklastry - dualizm wierszowo-kolumnowy
- Prelegent(ci)
- Sebastian Stawicki
- Afiliacja
- Termin
- 20 kwietnia 2012 14:15
- Pokój
- p. 5820
- Seminarium
- Research Seminar of the Logic Group: Approximate reasoning in data mining
Na seminarium przedstawię rozszerzenia klasycznych pojęć z teorii
zbiorów przybliżonych i eksploracji danych - reduktów i klastrów.
Rozszerzenia te polegają na wykorzystaniu dualizmu występującego
pomiędzy obiektami i ich atrybutami (dualizm wierszowo-kolumnowy).
Klaster w ogólności, to zbiór obiektów, które są do siebie podobne
względem zadanego kryterium. Zadanie szukania biklastrów
(biclustering, co-clustering, two-way clustering, subspace clustering)
to jednoczesne grupowanie wierszy i kolumn tablicy, tak aby
zoptymalizować pewną funkcję jakości. Dla lepszego zobrazowania możemy posłużyć się przykładem systemu informacyjnego o atrybutach binarnych, w którym szukanym biklastrem może jest "kwadratowy" (modulo permutacje kolumn i wierszy) fragment tablicy
(podzbiór obiektów i podzbiór atrybutów) wypełniony samymi jedynkami.
Redukt to nieredukowalny podzbiór atrybutów, który zachowuje
informację całego systemu lub tablicy decyzyjnej. Biredukt to para -
nieredukowalny podzbiór atrybutów (B) i nierozszerzalny podzbiór
obiektów (X), która zachowuje rozróżnialność w podzbiorze obiektów X
względem atrybutów z B.
Podczas wystąpienia spróbuję przybliżyć zarówno praktyczne aspekty
wykorzystania bireduktów i biklastrów, jak również zwrócić uwagę na
ich właściwości teoretyczne.