Nie jesteś zalogowany | Zaloguj się

Prelegent(ci): dr Marcin Sydow
Afiliacja: PJWSTK
Termin: 14 maja 2010 14:15
Pokój: p. 5820
Seminarium: Research Seminar of the Logic Group: Approximate reasoning in data mining

Podstawowym klasycznym zalozeniem przy obliczaniu porzadku wyników w wyszukiwarkach jest zalozenie o niezaleznosci przydatnosci poszczególnych wyników w odpowiedzi na zapytanie uzytkownika (ang. Independent Relevance Assumption). Wyniki prezentuje sie wtedy w nierosnacej kolejnosci dopasowania do zapytania. Podejscie takie jest efektywne, gdyz umozliwia stosowanie prostych algorytmów zachlannych do obliczania listy wyników. Tak uproszczony model ma jednak powazne wady, gdyz moze zwracac wyniki wysoce powtarzalne albo zdominowane przez najpopularniejsza interpretacje zapytania w przypadku zapytan wieloznacznych.

Podejscie bardziej subtelne, uwzgledniajace zaleznosci pomiedzy zwróconymi dokumentami przy obliczaniu ich przydatnosci, które nazywac bedziemy roboczo "dywersyfikacja wyników", stanowi obecnie jeden z najgoretszych tematów w dziedzinie wyszukiwania informacji (ang. Information Retrieval).

Na seminarium przedstawione zostana podstawy zagadnienia, rozszerzenia klasycznych miar przydatnosci wyników (NDCG), które uwzgledniaja dywersyfikacje, oraz wybrane aspekty algorytmiczne tego zagadnienia. Zreferowane zostana wybrane najnowsze prace z dziedziny oraz wymienione potencjalne kierunki dalszych badan, w tym autora, oraz pokazane beda zwiazki z podobnymi badaniami w pokrewnych dziedzinach takich jak bazy danych czy systemy rekomendacyjne.

Dywersyfikacja wyników w wyszukiwaniu informacji

Kariera

Strona internetowa

Bezpieczeństwo na Kampusie