Classification probabiliste non supervisée et visualisation des données séquentielles

Résumé. Nous proposons dans ce papier un nouvel algorithme de classification non supervisée à base de modèle de mélange topologique pour des données non i.i.d (non independently and identically distributed). Ce nouveau paradigme probabiliste, plonge les cartes topologiques probabilistes dans une formulation sous forme de chaînes de Markov cachées. Dans cette formulation, la génération d’une observation à un instant donné du temps est conditionnée par les états voisins au même instant du temps. Ainsi, une grande proximité impliquera une grande probabilité pour la contribution à la génération. L’approche proposée est évaluée en utilisant des données séquentielles réelles issues des bases de données de l’Institut Nationale de l’Audiovisuel (INA). Les résultats obtenus sont très encourageants et prometteurs.

[1]  Lawrence R. Rabiner,et al.  A tutorial on hidden Markov models and selected applications in speech recognition , 1989, Proc. IEEE.

[2]  Ah Chung Tsoi,et al.  A self-organizing map for adaptive processing of structured data , 2003, IEEE Trans. Neural Networks.

[3]  Sergio Martín,et al.  A Template-based Recognition System for On-line Handwritten Characters , 2009, J. Inf. Sci. Eng..

[4]  George Kollios,et al.  Extraction and clustering of motion trajectories in video , 2004, Proceedings of the 17th International Conference on Pattern Recognition, 2004. ICPR 2004..

[5]  Mustapha Lebbah,et al.  BeSOM : Bernoulli on Self-Organizing Map , 2007, 2007 International Joint Conference on Neural Networks.

[6]  Davide Bacciu,et al.  Compositional generative mapping of structured data , 2010, The 2010 International Joint Conference on Neural Networks (IJCNN).

[7]  Alfredo Vellido,et al.  Advances in clustering and visualization of time series using GTM through time , 2008, Neural Networks.

[8]  S. P. Luttrell,et al.  A Bayesian Analysis of Self-Organizing Maps , 1994, Neural Computation.

[9]  Marc Strickert,et al.  Neural Gas for Sequences , 2003 .

[10]  Djamel Bouchaffra,et al.  Embedding HMM’s-based models in a Euclidean space: The topological hidden Markov models , 2008, 2008 19th International Conference on Pattern Recognition.

[11]  Arsalane Zarghili,et al.  Self-organizing mixture models for text-independent speaker identification , 2014, CIST.