Analyse morphosémantique des composés savants : transposition du français à l’anglais

La plupart des vocabulaires spécialisés comprennent une part importante de lexèmes morphologiquement complexes, construits à partir de racines grecques et latines, qu’on appelle « composés savants ». Une analyse morphosémantique permet de décomposer et de donner des définitions à ces lexèmes, et semble pouvoir être appliquée de façon similaire aux composés de plusieurs langues. Cet article présente l’adaptation d’un analyseur morphosémantique, initialement dédié au français (DériF), à l’analyse de composés savants médicaux anglais, illustrant ainsi la similarité de structure de ces composés dans des langues européennes proches. Nous exposons les principes de cette transposition et ses performances. L’analyseur a été testé sur un ensemble de 1299 lexèmes extraits de la terminologie médicale WHO-ART : 859 ont pu être décomposés et définis, dont 675 avec succès. Outre une simple transposition d’une langue à l’autre, la méthode montre la potentialité d’un système multilingue.

[1]  Mathias Creutz,et al.  Unsupervised Morpheme Segmentation and Morphology Induction from Text Corpora Using Morfessor 1.0 , 2005 .

[2]  F Grémy,et al.  Morpho-semantic analysis and translation of medical compound terms. , 1991, Methods of information in medicine.

[3]  Fiammetta Namer Morphosémantique pour l'appariement de termes dans le vocabulaire médical : Approche multilingue , 2005 .

[4]  Franz Rainer,et al.  La formazione delle parole in italiano , 2004 .

[5]  C Lovis,et al.  Word segmentation processing: a way to exponentially extend medical dictionaries. , 1995, Medinfo. MEDINFO.

[6]  S Wolff The use of morphosemantic regularities in the medical vocabulary for automatic lexical coding. , 1984, Methods of information in medicine.

[7]  Marie-Christine Jaulent,et al.  Knowledge acquisition for computation of semantic distance between WHO-ART terms , 2006, MIE.

[8]  L M Norton,et al.  Morphosemantic Analysis of -ITIS Forms in Medical Language , 1980, Methods of Information in Medicine.

[9]  Robert H. Baud,et al.  Defining and relating biomedical terms: Towards a cross-language morphosemantics-based system , 2007, Int. J. Medical Informatics.

[10]  Pierre Zweigenbaum,et al.  Acquiring meaning for French medical terminology: contribution of morphosemantics , 2004, MedInfo.

[11]  F. Namer,et al.  Guessing the meaning of neoclassical compounds within LG : the case of pathology nouns , 2005 .

[12]  Martin Romacker,et al.  Towards a Multilingual Morpheme Thesaurus for Medical Free-Text Retrieval , 1999, MIE.

[13]  U Hahn,et al.  MorphoSaurus , 2005, Methods of Information in Medicine.