Nie jesteś zalogowany | Zaloguj się

Rozpoznawanie mowy ciągłej z wykorzystaniem modeli językowych specyficznych dla języka polskiego

Prelegent(ci)
Piotr Majewski
Afiliacja
Uniwersytet Warszawski
Termin
12 marca 2010 14:15
Pokój
p. 5820
Seminarium
Research Seminar of the Logic Group: Approximate reasoning in data mining

Referat poświęcony będzie modelom językowym - rozumianym jako modele probabilistyczne określające prawdopodobieństwo wystąpienia wyrazu w kontekście wyrazów go poprzedzających - uwzględniających specyfikę języka polskiego. Modele takie są przydatne w zadaniach rozpoznawania mowy ciągłej, ze względu na powszechne wykorzystanie w rozpoznawaniu klasyfikatorów Bayesa wskazujących jako wynik rozpoznawania wyrazy o największym prawdopodobieństwie a posteriori, do którego oszacowania niezbędne jest ustalenie prawdopodobieńswa a priori poszczególnych wyrazów. Język polski w porównaniu z językami, których modelowaniu badacze poświęcają więcej uwagi (jak na przykład język angielski) odznacza się cechami, takimi jak wielość fleksyjnych form wyrazów i swobodny szyk wyrazów w zdaniu, które powodują, że bezpośrednie zastosowanie modeli stosowanych dla języka angielskiego nie przynosi zadowalających rezultatów. Podczas referatu przedstawione zostaną modele które są lepiej dostosowane do języka polskiego.