Prédiction de la polysémie pour un terme biomédical

La polysemie est la caracteristique d'un terme a avoir plusieurs significations. La prediction de la polysemie est une premiere etape pour l'Induction de Sens (IS), qui permet de trouver des significations differentes pour un terme, ainsi que pour les systemes d'extraction d'information. En outre, la detection de la polysemie est importante pour la construction et l'en-richissement de terminologies et d'ontologies. Dans cet article, nous presentons une nouvelle approche pour predire si un terme biomedical est polysemique ou non, avec l'objectif a long terme d'enrichir les ontologies biomedicales apres avoir desambiguiser les termes candidats. Cette approche est basee sur l'utilisation de techniques de meta-apprentissage, plus precise-ment sur des meta-descripteurs. Dans ce contexte, nous proposons la definition de nouveaux meta-descripteurs, extraits directement du texte, et d'un graphe de co-occurrences des termes. Notre methode donne des resultats tres satisfaisants, avec une exactitude et F-mesure de 0.978.

[1]  Ian H. Witten,et al.  The WEKA data mining software: an update , 2009, SKDD.

[2]  F. Shafait,et al.  Dataset Generation for Meta-Learning , 2012 .

[3]  Jean Véronis,et al.  HyperLex: lexical cartography for information retrieval , 2004, Comput. Speech Lang..

[4]  Joakim Nivre,et al.  Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics , 2009 .

[5]  Nirav Bhatt,et al.  Ranking of Classifiers based on Dataset Characteristics using Active Meta Learning , 2013 .

[6]  Roberto Navigli A Quick Tour of Word Sense Disambiguation, Induction and Related Approaches , 2012, SOFSEM.

[7]  Peter A. Flach,et al.  Improved Dataset Characterisation for Meta-learning , 2002, Discovery Science.

[8]  Eneko Agirre,et al.  Evaluating and optimizing the parameters of an unsupervised graph-based WSD algorithm , 2006 .

[9]  Eneko Agirre,et al.  Personalizing PageRank for Word Sense Disambiguation , 2009, EACL.

[10]  Marianna Apidianaki,et al.  Latent Semantic Word Sense Induction and Disambiguation , 2011, ACL.

[11]  Giovanna Castellano,et al.  Meta-data: Characterization of Input Features for Meta-learning , 2005, MDAI.

[12]  Hinrich Schütze,et al.  Automatic Word Sense Discrimination , 1998, Comput. Linguistics.

[13]  Wlodzislaw Duch,et al.  Optimal Support Features for Meta-Learning , 2011, Meta-Learning in Computational Intelligence.

[14]  Ioana Stanoi,et al.  Automatic Term Ambiguity Detection , 2013, ACL.

[15]  Bridget T. McInnes,et al.  Exploiting MeSH indexing in MEDLINE to generate a data set for word sense disambiguation , 2011, BMC Bioinformatics.

[16]  Patrick Pantel,et al.  Discovering word senses from text , 2002, KDD.

[17]  Maguelonne Teisseire,et al.  Yet Another Ranking Function for Automatic Multiword Term Extraction , 2014, PolTAL.

[18]  Roberto Navigli,et al.  Inducing Word Senses to Improve Web Search Result Clustering , 2010, EMNLP.

[19]  Maguelonne Teisseire,et al.  Towards a Mixed Approach to Extract Biomedical Terms from Text Corpus , 2014, Int. J. Knowl. Discov. Bioinform..

[20]  Maguelonne Teisseire,et al.  BIOTEX: A system for Biomedical Terminology Extraction, Ranking, and Validation , 2014, International Semantic Web Conference.

[21]  Timothy Baldwin,et al.  Word Sense Induction for Novel Sense Detection , 2012, EACL.

[22]  Osmar R. Zaïane,et al.  Biomedical text disambiguation using UMLS , 2013, 2013 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (ASONAM 2013).

[23]  Mirella Lapata,et al.  Bayesian Word Sense Induction , 2009, EACL.