Example-based NLP for Minority Languages: Tasks, Resources and Tools

Dans cet expose nous analysons la relation entre le traitement automatique des langues minoritaires et les approches au Traitement des Langues Naturelles. Nous donnons un appercu des tâches qui ont ete affrontees et des approches utilisees. Vu que les ressources linguistiques sont limitees (telles que les dictionnaires et les corpus), le MLP emploie souvent des approches basees sur des regles, bien qu’elles demandent un investissement temporaire immense. L’approche statistique peut etre plus efficace a condition que des corpora appropries soient accessibles. Comme deuxieme alternative nous presentons l’approche basee sur des examples. L’avantage de cette approche est de necessiter des ressources linguistiques plus petites et d’integrer un module d’apprentissage. Nous demontrons que presque toutes les tâches usuelles du TALN peuvent etre affrontees par cette approche. Des ressources linguistiques et des outils sont souvent librement disponibles.