论文信息 - Ocena funkcjonalności systemu rozpoznawania mówcy dla zdegradowanej jakości sygnału głosowego

Ocena funkcjonalności systemu rozpoznawania mówcy dla zdegradowanej jakości sygnału głosowego

Streszczenie. W artykule przedstawiono wyniki badan automatycznego systemu rozpoznawania mowcy (ASR – ang. Automatic Speaker Recognition), przeprowadzonych na podstawie komercyjnej bazy glosow TIMIT. Badania prowadzone byly pod kątem zastosowania ASR jako systemu automatycznego rozpoznawania rozmowcy telefonicznego. Przedstawiono rowniez wplyw liczebności bazy glosow oraz stopien oddzialywania kompresji stratnej MP3 na skutecznośc rozpoznawania mowcy.

Andrzej P. Dobrowolski | Ewelina Majda | K. Kamiński

[1] W.J.J. Roberts,et al. Automatic speaker recognition using Gaussian mixture models , 1999, 1999 Information, Decision and Control. Data and Information Fusion Symposium, Signal Processing and Communications Symposium and Decision and Control Symposium. Proceedings (Cat. No.99EX251).

[2] Z. Piotrowski,et al. Subscriber authentication using GMM and TMS320C6713DSP , 2012 .

[3] Douglas A. Reynolds,et al. Speaker Verification Using Adapted Gaussian Mixture Models , 2000, Digit. Signal Process..

[4] Andrzej P. Dobrowolski,et al. Cepstral analysis in the speakers recognition systems , 2011, Signal Processing Algorithms, Architectures, Arrangements, and Applications SPA 2011.

[5] Andrzej P. Dobrowolski,et al. System automatycznego rozpoznawania mówcy z wykorzystaniem techniki cepstralnej i modeli mieszanin gaussowskich , 2013 .