Décomposition de spectrogrammes musicaux informée par des modèles de synthèse spectrale. Modélisation des variations temporelles dans les éléments sonores. (Decomposition of musical spectrograms informed by spectral synthesis models. Modeling of time variations in sound elements)

Cette these propose de nouvelles methodes de decomposition automatique de spectrogrammes de signaux musicaux. Les decompositions proposees sont issues de la factorisation en matrices non-negatives (NMF), puissante technique de reduction de rang reputee pour fournir une decomposition sur un petit nombre de motifs frequentiels automatiquement extraits des donnees ayant generalement un sens perceptif. La NMF ne permet cependant pas de modeliser de facon efficace certaines variations temporelles d'elements sonores non-stationnaires communement rencontrees dans la musique. Cette these propose donc d'introduire dans la NMF des modeles generatifs de spectrogrammes musicaux bases sur des modeles classiques de synthese sonore afin de pouvoir prendre en compte deux types de variations courantes : les variations d'enveloppe spectrale (sons d'instruments a cordes metalliques libres...) et les variations de frequence fondamentale (vibrato, prosodie...). L'introduction de modeles de synthese simples dans la NMF permet de proposer des decompositions capables de prendre en compte ces variations : l'utilisation d'un modele de synthese source/ filtre permet de modeliser les variations spectrales de certains objets musicaux au cours du temps. L'utilisation d'un modele d'atomes harmoniques parametriques inspire de la synthese additive ou bien l'utilisation d'un modele inspire de la synthese par table d'onde qui utilise des transformations d'un unique atome de base afin de recreer toute la tessiture de chaque instrument permettent de modeliser les variations de frequence fondamentale. Une application de separation de sources et une de transformation selective du son sont egalement presentees.

[1]  Christopher Raphael,et al.  Aligning music audio with symbolic scores using a hybrid graphical model , 2006, Machine Learning.

[2]  Pierre Leveau Décompositions parcimonieuses structurées : application à la représentation objet de la musique : modèles de signaux, algorithmes et applications , 2007 .

[3]  Christopher Raphael,et al.  A Classifier-Based Approach to Score-Guided Source Separation of Musical Audio , 2008, Computer Music Journal.

[4]  N. Bertin Les factorisations en matrices non-négatives. Approches contraintes et probabilistes, application à la transcription automatique de musique polyphonique. , 2009 .

[5]  Arshia Cont Realtime Audio to Score Alignment for Polyphonic Music Instruments, using Sparse Non-Negative Constraints and Hierarchical HMMS , 2006, 2006 IEEE International Conference on Acoustics Speech and Signal Processing Proceedings.

[6]  Pierre Comon,et al.  Independent component analysis, A new concept? , 1994, Signal Process..

[7]  Paris Smaragdis,et al.  Non-negative Matrix Factor Deconvolution; Extraction of Multiple Sound Sources from Monophonic Inputs , 2004, ICA.

[8]  T. Ens,et al.  Blind signal separation : statistical principles , 1998 .

[9]  Nicolas Lefebvre,et al.  Music Genre Estimation from Low Level Audio Features , 2004 .

[10]  Laurent Girin,et al.  A Watermarking-Based Method for Informed Source Separation of Audio Signals With a Single Sensor , 2010, IEEE Transactions on Audio, Speech, and Language Processing.

[11]  H. Sebastian Seung,et al.  Algorithms for Non-negative Matrix Factorization , 2000, NIPS.

[12]  Chih-Jen Lin,et al.  Projected Gradient Methods for Nonnegative Matrix Factorization , 2007, Neural Computation.

[13]  Tuomas Virtanen,et al.  Monaural Sound Source Separation by Nonnegative Matrix Factorization With Temporal Continuity and Sparseness Criteria , 2007, IEEE Transactions on Audio, Speech, and Language Processing.

[14]  H. Sebastian Seung,et al.  Learning the parts of objects by non-negative matrix factorization , 1999, Nature.

[15]  Slim Essid,et al.  Classification automatique des signaux audio-fréquences : reconnaissance des instruments de musique. (Automatic Classification of Audio Signals: Machine Recognition of Musical Instruments) , 2005 .