Modelisation markovienne de l'ecriture manuscrite application a la reconnaissance des adresses postales

Nous decrivons dans ce document une nouvelle methode de modelisation de l'ecriture pour la reconnaissance de mots ou de locutions manuscrites. La technique proposee consiste a realiser une caracterisation statistique de l'ecriture fondee sur les modeles de markov. Le systeme mis au point appartient a la famille des systeme omni-scripteur de reconnaissance hors-ligne des mots manuscrits sans contrainte dans un vocabulaire ouvert mais limite dynamiquement. Le caractere reel de l'application nous expose a plusieurs difficultes telles que la presence de tous les types d'ecriture possibles (baton, cursif, mixte), la variation dans les styles d'ecriture (ecriture penchee, taille variable, etc. ), le phenomene frequent des variantes d'ecriture, ou encore les erreurs des scripteurs lors de la redaction d'une phrase ou d'un mot. En revanche, l'application admet quelques caracteristiques positives qui facilitent la tache de reconnaissance. Notamment, les locutions sont composes de plusieurs mots, et sont donc codes sur plusieurs caracteres. Cette redondance reduit considerablement l'ambiguite entre les formes soumises a la reconnaissance. D'autre part, des phrases differentes possedent rarement des mots communs, ce qui augmente les chances de discrimination entre les differents candidats. Nous fondons notre systeme sur une approche de segmentation basee sur la reconnaissance guidee par lexique et utilisant les modeles de markov caches. Cette approche admet un caractere global en ce sens qu'elle privilegie les decisions douces par rapport aux decisions dures. La modelisation markovienne permet d'integrer plusieurs niveaux de connaissance au sein d'une representation unique. Ces niveaux correspondent a la reconnaissance au niveau caractere, au niveau mot, aux connaissances a priori sur le langage de l'application consideree, etc. Les differentes etapes du systeme interagissent pour delivrer une decision lors de la reconnaissance. Pour valider notre methode, nous avons developpe un systeme complet pour la reconnaissance des mots manuscrits dans les adresses postales. Ce systeme permet de reconnaitre et de localiser conjointement le nom de voie dans une ligne de distribution et possede la capacite d'etablir une decision de rejet en cas d'ambiguite ou si la ligne traitee ne correspond pas a une ligne de distribution. Les tests d'evaluation sur des images obtenues a partir des enveloppes du courrier reel donnent des resultats tres encourageants et prouvent la robustesse de notre systeme. Dans la premiere partie de ce rapport, nous donnons une vue generale du probleme de la reconnaissance de l'ecriture manuscrite en discutant les problemes rencontres et les differentes approches utilisees dans le domaine. La seconde partie decrit dans l'ordre chronologique les differentes phases de traitement qui composent notre systeme : les pretraitements, la segmentation des mots en caracteres, l'extraction de primitives et la reconnaissance.