Einsatz von Aussprachemodellen für Wörter in einem silbenorientierten Spracherkennungssystem
暂无分享,去创建一个
Bei der automatischen Erkennung fliesender Sprache ist es unerlaslich, die komplexe Gesamtaufgabe in kleinere Teilaufgaben zu zerlegen, die moglichst unabhangig voneinander bearbeitet werden konnen. Eine gunstige Zwischenstufe stellt die Wortebene dar, da die einzelnen Worter als Ausgangsbasis fur die grammatikalische und die semantische Analyse dienen konnen. Hier kommen Wortmodelle zum Einsatz, deren Aufgabe es ist, die moglichen Variationen in der Aussprache eines Wortes wiederzugeben. Fur die Verarbeitung groserer Wortschatze wird angestrebt, auch die Worter wiederum aus kleineren sprachlichen Einheiten aufzubauen. Im vorliegenden Beitrag wird zu diesem Zweck eine explizite Segmentierung der sprachlichen Auserung in sogenannte „Halbsilben“ vorgenommen; die Segmente werden in Form von Konsonantenfolgen und Vokalen klassifiziert. Nun mussen nur die Halbsilben selbst auf akustischer Ebene modelliert werden, und die silbenorientierten Wortmodelle lassen sich einfach mit lautsprachlichen Symbolen aufbauen.
[1] L. Baum,et al. A Maximization Technique Occurring in the Statistical Analysis of Probabilistic Functions of Markov Chains , 1970 .
[2] F. Jelinek,et al. Continuous speech recognition by statistical methods , 1976, Proceedings of the IEEE.
[3] L. R. Rabiner,et al. An introduction to the application of the theory of probabilistic functions of a Markov process to automatic speech recognition , 1983, The Bell System Technical Journal.