Nie jesteś zalogowany | Zaloguj się

Klasyfikacja polskich tekstów w oparciu o preferencje użytkownika

Prelegent(ci)
Krzysztof Sopyła
Termin
15 stycznia 2010 14:15
Seminarium
Research Seminar of the Logic Group: Approximate reasoning in data mining

Najczęstszym zadaniem klasyfikacji tekstów jest przypisanie danego dokumentu do klasy zawierającej informację czego ten tekst dotyczy (sportu, medycyny itp.) W swojej pracy postanowiłem zbadać czy nowoczesne algorytmy jak SVM (suport vector machines) potrafią dobrze klasyfikować tekst na podstawie subiektywnych ocen ludzi - tak aby w automatyczny sposób weryfikować, czy tekst jest interesujący z punktu widzenia danego użytkownika? Próbowano także odpowiedzieć na pytanie jakie jądra w tej sytuacji będą działały dobrze oraz wybrać stosowną reprezentację tekstu. Jako dane testowe posłużyły polskie artykuły z wikipedii.