Kombinacja metody najbliższych sąsiadów z indukcją reguł dla danych niezbalansowanych
- Prelegent(ci)
- Grzegorz Góra
- Termin
- 14 czerwca 2019 14:15
- Pokój
- p. 5820
- Seminarium
- Seminarium badawcze Zakładu Logiki: Wnioskowania aproksymacyjne w eksploracji danych
Chciałbym przedstawić wyniki mojej powstającej pracy doktorskiej. Praca dotyczy klasyfikacji binarnych danych niezbalansowanych. Są to takie dane, w których mamy dwie klasy decyzyjne, a przykłady z jednej klasy (większościowej) występują znacznie częściej niż przykłady z drugiej klasy (mniejszościowej). Jednocześnie klasa mniejszościowa jest ważniejsza z punktu widzenia predykcji np. są to pacjenci zagrożeni jakąś chorobą. Tego typu dane często występują w praktyce i ważne jest zastosowanie metod, które uwzględniają ten aspekt. Istotą problemu niezbalansowania jest fakt, że zastosowanie klasycznych mechanizmów uczenia na niezbalansowanym zbiorze danych może prowadzić do faworyzowania przez wyuczony klasyfikator klasy większościowej kosztem klasy mniejszościowej. Moja praca bazuje na opracowanym kiedyś systemie łączącym metody najbliższych sąsiadów z indukcją reguł (RIONA). System ten był jednakże przeznaczony do danych zbalansowanych. Rozwinięciem tego systemu jest system RIONIDA służący do klasyfikacji binarnych danych niezbalansowanych. Zaprezentuję główne idee związane z tym algorytmem oraz wyniki porównawcze z innymi podejściami do danych niezbalansowanych.