Méthodes d'acquisition lexicale en TAO : des dictionnaires spécialisés propriétaires aux bases lexicales généralistes et ouvertes

L'acquisition lexicale a grande echelle est un probleme majeur depuis les debuts de la TA, il y a pres de 50 ans. On presente ici les trois approches essentielles, avec leur contexte, leur methodologie, et leurs avantages et inconvenients. La premiere consiste a travailler directement sur les dictionnaires specialises pour la TA, la seconde a creer des bases lexicales specialisees, en general asymetriques et proprietaires comme les dictionnaires specialises, mais parfois utilisables pour d'autres applications que la TA, et la troisieme a construire des bases lexicales non seulement generalistes, c'est a dire a usages multiples, tant humains que machinaux, mais aussi intrinsequement symetriques, linguistiquement tres detaillees, potentiellement tres grandes, tant en nombre de vocables qu'en nombre de langues, et ouvertes. Il semble en effet que la seule solution permettant d'eviter des couts prohibitifs soit d'utiliser un modele a la Linux, c'est a dire de mutualiser la construction et l'utilisation des ressources lexicales dans un processus de collaboration et d'echange a travers le reseau.

[1]  Anne-Marie Loffler-Laurian,et al.  La traduction automatique , 1996 .

[2]  Hai Doan-Nguyen,et al.  Accumulation of Lexical Sets: Acquisition of Dictionary Resources and Production of New Lexical Sets , 1998, ACL.

[3]  Gilles Sérasset Recent Trends of Electronic Dictionary Research and Development in Europe , 1994 .

[4]  Gilles Sérasset,et al.  Informatisation du dictionnaire Explicatif et Combinatoire , 1997 .

[5]  Dewan Bahasa dan Pustaka Kamus Perancis Melayu Dewan = Dictionnaire franc̲ais-malais , 1996 .

[6]  Christian Boitet,et al.  Automated Translation at Grenoble University , 1985, Comput. Linguistics.

[7]  Hervé Blanchon Perspectives of DBMT for monolingual authors on the basis of LIDIA-1, an implemented mock-up , 1994, COLING.

[8]  Gilles Sérasset,et al.  Sublim : un systeme universel de bases lexicales multilingues et Nadia : sa specialisation aux bases lexicales interlingues par acceptions. (Sublim: A Universal Lexical Database Manager and Nadia: its Specialisation for Acception Based Interlingual Lexical Database) , 1994 .

[9]  Gilles Sérasset lnterlinguai Lexical Organisation for Multilingual Lexical Databases in NADIA , 1994, COLING.

[10]  CHRISTIAN BOITET,et al.  Recent developments in Russian-French machine translation at Grenoble , 1981 .

[11]  Daniel Bachut,et al.  Software tools for the environment of a computer aided translation system , 1984 .

[12]  Christian Boitet,et al.  Toward Integrated Dictionaries for M(a)T: motivations and linguistic organization , 1986, COLING.

[13]  Christian Boitet,et al.  On UNL as the future “html of the linguistic content” & the reuse of existing NLP components in UNL-related applications with the example of a UNL-French deconverter , 2000, COLING.

[14]  Gilles Sérasset Le projet NADIA-DEC : vers un dictionnaire explicatif et combinatoire informatisé ? , 1997 .

[15]  John Chandioux,et al.  MÉTÉO : un système à l’épreuve du temps , 1981 .

[16]  Jun'ichi Tsujii Future Directions of Machine Translation , 1986, COLING.