论文信息 - Méta-Étiqueteur Adaptatif : vers une utilisation pragmatique des ressources linguistiques

Méta-Étiqueteur Adaptatif : vers une utilisation pragmatique des ressources linguistiques

Le traitement automatique du langage requiert des corpus textuels de plus en plusvolumineux, entre autres pour les etiqueteurs morpho-syntaxiques. Ces processus detraitement ne sont pas exempts d'erreurs. Dans l'optique d'ameliorer cet etiquetage de corpusheterogenes (composes de textes tout-venant), une approche adaptative au type de texteutilisant les ressources produites par une campagne d'evaluation sera proposee. Les resultatsd'une premiere validation seront presentes sur les donnees MULTITAG. Les faits suivantssont constates : les textes ne sont pas homogenes en terme de distribution de parties dudiscours, les classifications a priori ne fournissent pas une homogeneite en terme deperformance et un meme texte peut produire des variations positives pour un systeme etnegatives pour un autre. De plus, il existe une relation entre la typologie de textes obtenue defacon non supervisee sur le jeu de caracteres et les variations de performance.

Gabriel Illouz

[1] Donna Harman. The text REtrieval conferences (TRECs) and the cross- language track , 1998 .

[2] References , 1971 .

[3] Adam Kilgarriff,et al. SENSEVAL: an exercise in evaluating world sense disambiguation programs , 1998, LREC.

[4] Its'hak Dinstein,et al. A comparative study of neural network based feature extraction paradigms , 1999, Pattern Recognit. Lett..

[5] Douglas Biber,et al. Using Register-Diversified Corpora for General Language Studies , 1993, Comput. Linguistics.

[6] John W. Sammon,et al. A Nonlinear Mapping for Data Structure Analysis , 1969, IEEE Transactions on Computers.

[7] Lynette Hirschman,et al. Language understanding evaluations: lessons learned from MUC and ATIS , 1998, LREC.

[8] Patrick Paroubek,et al. Les procédures de mesure automatique de l"action GRACE pour l"évaluation des assignateurs de Parties du Discours pour le Français , 1997 .

[9] Llu S Mm Arquez, Llu S Padrr,et al. Improving Tagging Accuracy by Using Voting Taggers , 1998 .