Extension de requêtes par relations morphologiques acquises automatiquement

Cet article s'interesse a la prise en compte de la variation morphologique en recherche d'information. L'approche proposee est une methode simple de reconnaissance des variantes morphologiques utilisees pour l'enrichissement des requetes au sein d'un systeme de recherche d'information (SRI). A l'inverse de nombreux travaux existants, la technique proposee presente la particularite de ne necessiter aucunes ressources ni connaissances externes, et d'etre ainsi applicable a une grande variete de langues. Les evaluations de cette approche realisees sur plusieurs collections de documents, sur 6 langues et comparees a differents outils existants (stemmer, lemmatiseur) attestent de l'interet de la methode puisqu 'une amelioration significative des performances des SRI est constatee dans tous les cas.

[1]  John A. Goldsmith,et al.  Unsupervised Learning of the Morphology of a Natural Language , 2001, CL.

[2]  Eric Gaussier,et al.  Unsupervised learning of derivational morphology from inflectional lexicons , 1999 .

[3]  Stefan Schulz,et al.  Bootstrapping dictionaries for cross-language information retrieval , 2005, SIGIR '05.

[4]  Julie Beth Lovins,et al.  Development of a stemming algorithm , 1968, Mech. Transl. Comput. Linguistics.

[5]  Miguel A. Alonso,et al.  Using Syntactic Dependency-Pairs Conflation to Improve Retrieval Performance in Spanish , 2002, CICLing.

[6]  David A. Hull Using statistical testing in the evaluation of retrieval experiments , 1993, SIGIR.

[7]  Donna K. Harman,et al.  How effective is suffixing? , 1991, J. Am. Soc. Inf. Sci..

[8]  J. J. Rocchio,et al.  Relevance feedback in information retrieval , 1971 .

[9]  Yves Lepage,et al.  De l'analogie rendant compte de la commutation en linguistique , 2003 .

[10]  David A. Hull Stemming algorithms: a case study for detailed evaluation , 1996 .

[11]  W. Bruce Croft,et al.  Corpus-based stemming using cooccurrence of word variants , 1998, TOIS.

[12]  Claude de Loupy,et al.  Evaluation de l'apport de connaissances linguistiques en desambigui͏̈sation sémantique et recherche documentaire , 2000 .

[13]  Fabienne Moreau,et al.  Contributions des techniques du traitement automatique des langues à la recherche d'information , 2005 .

[14]  Peter Willett,et al.  The Effectiveness of Stemming for Natural-Language Access to Slovene Textual Data , 1992, J. Am. Soc. Inf. Sci..

[15]  W. Bruce Croft,et al.  Improving the effectiveness of information retrieval with local context analysis , 2000, TOIS.

[16]  Jacques Savoy,et al.  A Stemming Procedure and Stopword List for General French Corpora , 1999, J. Am. Soc. Inf. Sci..

[17]  Peter Willett,et al.  The effectiveness of stemming for natural‐language access to Slovene textual data , 1992 .

[18]  Stephen E. Robertson,et al.  Okapi at TREC-7: Automatic Ad Hoc, Filtering, VLC and Interactive , 1998, TREC.

[19]  Michael Fuller Justin Zobel,et al.  Conflation-based Comparison of Stemming Algorithms , 1998 .

[20]  Jimmy J. Lin,et al.  What Works Better for Question Answering: Stemming or Morphological Query Expansion? , 2004 .

[21]  Douglas W. Oard,et al.  CLEF Experiments at Maryland: Statistical Stemming and Backoff Translation , 2000, CLEF.

[22]  Avi Arampatzis,et al.  Linguistically Motivated Information Retrieval , 2000 .

[23]  Martin F. Porter,et al.  An algorithm for suffix stripping , 1997, Program.

[24]  Peter Willett,et al.  An evaluation of some conflation algorithms for information retrieval , 1981 .

[25]  Robert Krovetz,et al.  Viewing morphology as an inference process , 1993, Artif. Intell..

[26]  Derrick Higgins,et al.  Automatic Language-Specific Stemming in Information Retrieval , 2000, CLEF.

[27]  David A. Hull,et al.  A Detailed Analysis of English Stemming Algorithms , 2006 .

[28]  Isabelle Moulinier,et al.  West Group at CLEF2000: Non-English Monolingual Retrieval , 2000, CLEF.

[29]  Claude Roux,et al.  Recherche d'information en français et traitement automatique des langues , 2000 .