Détermination d'indices acoustiques robustes pour l'identification automatique des parlers arabes

Ce travail de these a pour objectif la recherche d'indices acoustiques robustes en vue de l'identification automatique des parlers arabes par zones geographiques. Cette problematique est nee de la volonte d'integrer les recherches en dialectologie arabe au champ nouveau et prometteur de l'identification automatique des langues. Par le biais d'experiences perceptuelles, nous avons determine un faisceau d'indices discriminants permettant la distinction des parlers maghrebins vs. Orientaux. Parmi l'ensemble des traits degages, deux sont apparus comme etant a priori pertinents pour notre propos du fait de leur realisation exclusive sur l'une ou l'autre des deux aires dialectales concernees. Il s'agit de la distribution des segments vocaliques et de la realisation de l'opposition de duree vocalique. Differentes analyses acoustiques nous ont permis de caracteriser la distribution des voyelles dans l'espace acoustique et d'etablir une opposition pertinente entre les parlers maghrebins privilegiant la generation de voyelles centrales et les parlers orientaux preferant les positions peripheriques. Du point de vue de la duree des segments vocaliques, notre etude revele que l'opposition de duree est realisee, en parole spontanee, dans des rapports comparables pour les parlers appartenant a une meme zone geographique. En revanche, d'une zone dialectale a l'autre, les rapports mis en œuvre sont significativement differents, la tendance etant que les rapports voyelle longue/voyelle breve croissent d'Ouest en Est. La co-occurrence de ces deux criteres de discrimination sur chacune des deux aires dialectales etudiees, nous a permis de les considerer comme potentiellement pertinents pour la discrimination automatique des parlers arabes par zone geographique. Nous avons ainsi mis en place des experiences d'identification automatique en utilisant un modele de reconnaissance base sur la detection automatique des voyelles et la modelisation statistique des systemes vocaliques. Les resultats obtenus a l'issue de ces expe��riences valident la robustesse et la pertinence des deux criteres de discrimination definis dans ce travail. En effet, nous montrons qu'il est possible de discriminer les parlers maghrebins des parlers orientaux sur la base des caracteristiques spectrales et quantitatives des segments vocaliques detectes automatiquement et nous obtenons entre 70 % et 90 % d'identification correcte en fonction du nombre de parametres de modelisation retenus