Méthodes à haute résolution pour l'estimation et le suivi de sinusoïdes modulées. Application aux signaux de musique

Dans le cadre du traitement de la parole et des signaux de musique, la partie tonale d'une grande variete de sons est souvent representee comme une somme de sinusoides a parametres lentement variables. La transformee de Fourier reste un outil privilegie pour estimer les parametres de ce modele. Cela est du a sa robustesse et a l'existence d'algorithmes rapides. En revanche, elle presente une resolution frequentielle limitee. Les methodes d'analyse spectrale a Haute Resolution (HR) s'affranchissent de cette limite en exploitant la structure particuliere du modele de signal. Elles restent cependant peu utilisees dans le cadre du traitement du signal audio, notamment en raison de leur cout de calcul eleve. La reduction de cette complexite est l'une des principales contributions de cette these. Afin de suivre les variations temporelles des parametres, des algorithmes rapides de poursuite de sous-espaces (baptises FAPI, YAST et SWASVD), ainsi qu'une version adaptative de la methode ESPRIT sont developpes. Leur application a des signaux audio n'est pas immediate, en raison du nombre de composantes sinusoidales inconnu a priori, et de difficultes inherentes a la nature et a la variete de ces signaux. Des pretraitements specifiques sont mis au point afin d'assurer la robustesse de l'analyse HR, et une methode originale de selection de l'ordre de modelisation est proposee. Enfin, une partie du document est consacree a l'estimation de melanges d'exponentielles complexes modulees par des polynomes, qui resultent de la presence de poles multiples. Cette etude debouche sur le developpement d'une version generalisee de la methode ESPRIT et sur l'analyse statistique de ses performances.

[1]  Heiko Purnhagen,et al.  HILN-the MPEG-4 parametric audio coding tools , 2000, 2000 IEEE International Symposium on Circuits and Systems. Emerging Technologies for the 21st Century. Proceedings (IEEE Cat No.00CH36353).

[2]  Peter Strobach Square hankel SVD subspace tracking algorithms , 1997, Signal Process..

[3]  Tapan K. Sarkar,et al.  Matrix pencil method for estimating parameters of exponentially damped/undamped sinusoids in noise , 1990, IEEE Trans. Acoust. Speech Signal Process..

[4]  Slim Essid,et al.  Non-stationary signal parametric modeling techniques with an application to low bit rate audio coding , 2002, 6th International Conference on Signal Processing, 2002..

[5]  Thomas F. Quatieri,et al.  Speech analysis/Synthesis based on a sinusoidal representation , 1986, IEEE Trans. Acoust. Speech Signal Process..

[6]  Thomas Kailath,et al.  ESPRIT-estimation of signal parameters via rotational invariance techniques , 1989, IEEE Trans. Acoust. Speech Signal Process..

[7]  J. Smith,et al.  A Sound Decomposition System Based on a Deterministic plus Residual Model , 1990 .

[8]  Ed F. Deprettere,et al.  Robust exponential modeling of audio signals , 1998, Proceedings of the 1998 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP '98 (Cat. No.98CH36181).

[9]  Gene H. Golub,et al.  Matrix computations , 1983 .

[10]  Y. Hua,et al.  Fast orthonormal PAST algorithm , 2000, IEEE Signal Processing Letters.

[11]  Peter Strobach,et al.  Fast recursive subspace adaptive ESPRIT algorithms , 1998, IEEE Trans. Signal Process..

[12]  R. Kumaresan,et al.  Estimating the parameters of exponentially damped sinusoids and pole-zero modeling in noise , 1982 .

[13]  Roland Badeau,et al.  Sintrack analysis for tracking components of musical signals , 2002 .

[14]  J. Laroche The use of the matrix pencil method for the spectrum analysis of musical signals , 1993 .

[15]  Gerhard Stoll,et al.  ISO-MPEG-1 Audio: A Generic Standard for Coding of High-: Quality Digital Audio , 1994 .