Rozpoznawanie mowy ciągłej z wykorzystaniem modeli językowych specyficznych dla języka polskiego
- Speaker(s)
- Piotr Majewski
- Affiliation
- Uniwersytet Warszawski
- Date
- March 12, 2010, 2:15 p.m.
- Room
- room 5820
- Seminar
- Seminarium badawcze Zakładu Logiki: Wnioskowania aproksymacyjne w eksploracji danych
Referat poświęcony będzie modelom językowym - rozumianym jako modele probabilistyczne określające prawdopodobieństwo wystąpienia wyrazu w kontekście wyrazów go poprzedzających - uwzględniających specyfikę języka polskiego. Modele takie są przydatne w zadaniach rozpoznawania mowy ciągłej, ze względu na powszechne wykorzystanie w rozpoznawaniu klasyfikatorów Bayesa wskazujących jako wynik rozpoznawania wyrazy o największym prawdopodobieństwie a posteriori, do którego oszacowania niezbędne jest ustalenie prawdopodobieńswa a priori poszczególnych wyrazów. Język polski w porównaniu z językami, których modelowaniu badacze poświęcają więcej uwagi (jak na przykład język angielski) odznacza się cechami, takimi jak wielość fleksyjnych form wyrazów i swobodny szyk wyrazów w zdaniu, które powodują, że bezpośrednie zastosowanie modeli stosowanych dla języka angielskiego nie przynosi zadowalających rezultatów. Podczas referatu przedstawione zostaną modele które są lepiej dostosowane do języka polskiego.