Rozpoznawanie mowy ciągłej z wykorzystaniem modeli językowych specyficznych dla języka polskiego
- Prelegent(ci)
- Piotr Majewski
- Afiliacja
- Uniwersytet Warszawski
- Termin
- 12 marca 2010 14:15
- Pokój
- p. 5820
- Seminarium
- Research Seminar of the Logic Group: Approximate reasoning in data mining
Referat poświęcony będzie modelom językowym - rozumianym jako modele probabilistyczne określające prawdopodobieństwo wystąpienia wyrazu w kontekście wyrazów go poprzedzających - uwzględniających specyfikę języka polskiego. Modele takie są przydatne w zadaniach rozpoznawania mowy ciągłej, ze względu na powszechne wykorzystanie w rozpoznawaniu klasyfikatorów Bayesa wskazujących jako wynik rozpoznawania wyrazy o największym prawdopodobieństwie a posteriori, do którego oszacowania niezbędne jest ustalenie prawdopodobieńswa a priori poszczególnych wyrazów. Język polski w porównaniu z językami, których modelowaniu badacze poświęcają więcej uwagi (jak na przykład język angielski) odznacza się cechami, takimi jak wielość fleksyjnych form wyrazów i swobodny szyk wyrazów w zdaniu, które powodują, że bezpośrednie zastosowanie modeli stosowanych dla języka angielskiego nie przynosi zadowalających rezultatów. Podczas referatu przedstawione zostaną modele które są lepiej dostosowane do języka polskiego.