Indexation sémantique des documents multilingues

Dans cet article, nous decrivons une methode d’indexation semantique adaptee aux documents multilingues. Nous proposons une demarche d’extraction des concepts et des relations entre les concepts. L’idee centrale de notre travail est que l’utilisation de ressources semantiques externes telle que les ontologies et les thesaurus peut ameliorer l’efficacite des processus d’indexation. La methode proposee peut s’appliquer a plusieurs langues car elle construit ses ressources linguistiques directement a partir du corpus multilingue.

[1]  G. Āllport The Psycho-Biology of Language. , 1936 .

[2]  Chris Buckley,et al.  Learning routing queries in a query zone , 1997, SIGIR '97.

[3]  Didier Bourigault,et al.  LEXTER, a Natural Language Processing Tool for Terminology Extraction , 1996 .

[4]  Herbert Coblans,et al.  Progress in Documentation. , 1972 .

[5]  Vojtech Svátek,et al.  Discovery of Lexical Entries for Non-taxonomic Relations in Ontology Learning , 2004, SOFSEM.

[6]  Jianhua Chen,et al.  Knowledge-based methods for automatic extraction of domain-specific ontologies , 2007 .

[7]  G. Zipf,et al.  The Psycho-Biology of Language , 1936 .

[8]  SmadjaFrank Retrieving collocations from text , 1993 .

[9]  Peter D. Turney Expressing Implicit Semantic Relations without Supervision , 2006, ACL.

[10]  Dan I. Moldovan,et al.  Learning Semantic Constraints for the Automatic Discovery of Part-Whole Relations , 2003, NAACL.

[11]  Eugene Charniak,et al.  Finding Parts in Very Large Corpora , 1999, ACL.

[12]  Mohand Boughanem,et al.  An Information Retrieval Driven by Ontology: from Query to Document Expansion , 2007, RIAO.

[13]  Chantal Enguehard,et al.  Automatic Natural Acquisition of a Terminology , 1995, J. Quant. Linguistics.

[14]  Aldo Gangemi,et al.  Unsupervised Learning of Semantic Relations between Concepts of a Molecular Biology Ontology , 2005, IJCAI.

[15]  Florence Le Priol Extraction et capitalisation automatiques de connaissances à partir de documents textuels : Seek-Java : identification et interprétation de relations entre concepts , 2000 .

[16]  Sophia Ananiadou,et al.  Classifying Technical Terms , 1999, ELPUB.

[17]  Béatrice Daille,et al.  Study and Implementation of Combined Techniques for Automatic Extraction of Terminology , 1994 .

[18]  Christophe Jouis Contributions à la conceptualisation et à la Modélisation des connaissances à partir d'une analyse linguistique de textes : réalisation d'un prototype : le système SEEK , 1993 .

[19]  Frank Smadja,et al.  Retrieving Collocations from Text: Xtract , 1993, CL.

[20]  Ludovic Lebart,et al.  Analyse statistique des donnees textuelles : questions ouvertes et lexicométrie , 1988 .

[21]  Hans Peter Luhn,et al.  The Automatic Creation of Literature Abstracts , 1958, IBM J. Res. Dev..

[22]  W. Bruce Croft,et al.  The INQUERY Retrieval System , 1992, DEXA.

[23]  G. Zipf The Psycho-Biology Of Language: AN INTRODUCTION TO DYNAMIC PHILOLOGY , 1999 .

[24]  P. Séguéla,et al.  Extraction de relations sémantiques entre termes et enrichissement de modèles du domaine , 1999 .

[25]  Marti A. Hearst Automatic Acquisition of Hyponyms from Large Text Corpora , 1992, COLING.

[26]  Stephen E. Robertson,et al.  On relevance weights with little relevance information , 1997, SIGIR '97.

[27]  B. Daille Approche mixte pour l'extraction de terminologie : statistique lexicale et filtres linguistiques , 1994 .

[28]  Josette Rebeyrolle,et al.  Construction d'une base de connaissances terminologiques à partir de textes : expérimentation et définition d'une méthode , 2000 .

[29]  Paul Buitelaar,et al.  RelExt: A Tool for Relation Extraction from Text in Ontology Extension , 2005, SEMWEB.

[30]  Karen Sparck Jones Automatic keyword classification for information retrieval , 1971 .