Utilisation et apprentissage de modeles de langage pour la reconnaissance de la parole continue

Le present travail s'interesse a la modelisation du langage pour la reconnaissance de la parole continue. Cette modelisation a pour objectif le controle du decodage acoustique par une information contraignant les sequences de mots a reconnaitre. Dans la premiere partie, nous definissons le contexte general d'utilisation d'un modele de langage. Nous y abordons le cadre probabiliste et les aspects algorithmiques de l'utilisation de modeles de markov caches en reconnaissance de la parole continue. Nous detaillons l'algorithme de viterbi et la strategie de recherche en faisceau qui lui est associee. La seconde partie de notre travail traite d'un type particulier de modeles de langage, ceux bases sur une grammaire hors-contexte probabiliste ou non. Nous proposons une approche originale pour l'integration d'un tel modele dans l'algorithme de viterbi. Elle utilise un developpement d'une structure recursive qui definit dynamiquement l'espace de recherche du decodage acoustique. A ce propos, nous montrons l'interet d'une mise sous forme normale de greibach de la grammaire hors-contexte. Nous etudions egalement la complexite theorique d'un algorithme de transformation sous cette forme normale. Les performances de notre approche sont evaluees dans differents systemes de reconnaissance de la parole en mettant l'accent sur sa complexite pratique. Dans la troisieme partie, nous nous interessons a l'apprentissage automatique de modeles de langage definis par le biais d'une grammaire formelle. En particulier, nous nous concentrons sur l'inference de grammaires regulieres a partir d'echantillons positif et negatif d'un langage. Nous proposons une etude theorique detaillee de l'espace de recherche de ce probleme et nous demontrons des proprietes originales permettant de guider la construction d'une solution. Nous introduisons egalement un nouveau point de vue qui consiste a traiter l'inference reguliere comme un probleme d'optimisation combinatoire. Dans ce cadre, nous developpons un algorithme d'inference par optimisation genetique. Ensuite, nous etudions l'inference reguliere sur base d'une presentation sequentielle des donnees d'apprentissage. A cette fin, une extension incrementale d'un algorithme connu est proposee. Nous en demontrons la convergence et nous etudions sa complexite theorique. Finalement, nous definissons deux protocoles d'evaluation de methodes d'inference et nous comparons les differents algorithmes etudies