Modélisation du prétraitement des textes

Dans cet article, nous definissons un modele pour l'etape de pretraitement des textes dans le cadre de la fouille de textes et plus generalement de l'extraction d'informations a partir de textes. Cet article ne contient pas les details de l'implementation. L'objectif est d'obtenir un modele generique de normalisation des textes bruts. La motivation de cet article est de generaliser les travaux assez confidentiels et specialises qui existent pour cette etape de pretraitement. Cette etape est pourtant incontournable et d'elle depend grandement la qualite des analyses obtenues a toutes les etapes ulterieures.