Le projet NADIA-DEC : vers un dictionnaire explicatif et combinatoire informatisé ?

Dans le domaine de l'ingenierie linguistique et de la connaissance, le probleme des ressources lexicales et linguistiques s'est toujours pose. Neanmoins, l'avancee des techniques du Traitement Automatique des Langues Naturelles (TALN) l'a rendu plus sensible. Il nous faut maintenant pouvoir repondre a des besoins importants en terme de quantite, de qualite et de complexite. La complexite et la diversite des informations requises augmente avec les exigences des outils de TALN ainsi qu'avec le developpement de nouvelles applications (humaines ou machinales). Si la recuperation (semi)automatique d'information lexicale est une piste, elle ne pourra remplacer la creation manuelle de dictionnaires. Nous nous sommes donc interesse a la construction d'outils pour lexicographes et lexicologues. Afin d'avoir une bonne comprehension des problemes qui se posent, nous avons decide d'informatiser un dictionnaire complexe, contenant de nombreuses informations structurees, le dictionnaire explicatif et combinatoire du francais contemporain (DEC). Le DEC etant un travail de lexicologie, il ne s'agit donc pas a proprement parler d'un dictionnaire, mais plutot d'un ensemble d'entrees destinees a illustrer une theorie linguistique. Ce ne sont donc pas les donnees que l'on a informatise, mais le processus de redaction de ces donnees. Les travaux menes au cours du projet NADIA-DEC s'appuient d'une part sur le systeme SUBLIM [Serasset 1994] defini au laboratoire GETA-CLIPS de l'universite Joseph Fourier (Grenoble I) et, d'autre part, sur les travaux de lexicologie menes par l'equipe d'Igor Mel'auk [Mel'auk et al. 1995] au laboratoire GRESLET de l'universite de Montreal. Il a recu le soutient du reseau LTT de l'AUPELF-UREF et des ministeres francais et canadiens des affaires etrangeres.