Méta-Étiqueteur Adaptatif : vers une utilisation pragmatique des ressources linguistiques

Le traitement automatique du langage requiert des corpus textuels de plus en plusvolumineux, entre autres pour les etiqueteurs morpho-syntaxiques. Ces processus detraitement ne sont pas exempts d'erreurs. Dans l'optique d'ameliorer cet etiquetage de corpusheterogenes (composes de textes tout-venant), une approche adaptative au type de texteutilisant les ressources produites par une campagne d'evaluation sera proposee. Les resultatsd'une premiere validation seront presentes sur les donnees MULTITAG. Les faits suivantssont constates : les textes ne sont pas homogenes en terme de distribution de parties dudiscours, les classifications a priori ne fournissent pas une homogeneite en terme deperformance et un meme texte peut produire des variations positives pour un systeme etnegatives pour un autre. De plus, il existe une relation entre la typologie de textes obtenue defacon non supervisee sur le jeu de caracteres et les variations de performance.