Nie jesteś zalogowany | Zaloguj się

Dywersyfikacja wyników w wyszukiwaniu informacji

Prelegent(ci)
dr Marcin Sydow
Afiliacja
PJWSTK
Termin
14 maja 2010 14:15
Pokój
p. 5820
Seminarium
Research Seminar of the Logic Group: Approximate reasoning in data mining

Podstawowym klasycznym zalozeniem przy obliczaniu porzadku wyników w wyszukiwarkach jest zalozenie o niezaleznosci przydatnosci poszczególnych wyników w odpowiedzi na zapytanie uzytkownika (ang. Independent Relevance Assumption). Wyniki prezentuje sie wtedy w nierosnacej kolejnosci dopasowania do zapytania. Podejscie takie jest efektywne, gdyz umozliwia stosowanie prostych algorytmów zachlannych do obliczania listy wyników.  Tak uproszczony model ma jednak powazne wady, gdyz moze zwracac wyniki wysoce powtarzalne albo zdominowane przez najpopularniejsza  interpretacje zapytania w przypadku zapytan wieloznacznych.

Podejscie bardziej subtelne, uwzgledniajace zaleznosci pomiedzy  zwróconymi dokumentami przy obliczaniu ich przydatnosci, które nazywac bedziemy roboczo "dywersyfikacja wyników", stanowi obecnie jeden z najgoretszych tematów w dziedzinie wyszukiwania informacji (ang. Information  Retrieval).

Na seminarium przedstawione zostana podstawy zagadnienia, rozszerzenia klasycznych miar przydatnosci wyników (NDCG), które uwzgledniaja dywersyfikacje, oraz wybrane aspekty algorytmiczne tego zagadnienia. Zreferowane zostana wybrane najnowsze prace z dziedziny oraz wymienione potencjalne kierunki dalszych badan, w tym autora, oraz pokazane beda zwiazki z podobnymi badaniami w pokrewnych dziedzinach takich jak bazy danych czy systemy rekomendacyjne.