Utilisation de la langue naturelle pour l'interrogation de documents structurés

Le langage de requete est l'indispensable interface entre l'utilisateur et l'outil de recherche. Simplifie au maximum dans les cas ou les moteurs indexent essentiellement des documents plats, il devient fort complexe lorsqu'il s'adresse a des documents structures et qu'il s'a git de definir des contraintes portant a la fois sur la structure et le contenu. L'approche ici- decrite propose d'utiliser la langue naturelle comme interface pour exprimer de telles requetes. L'article decrit dans un premier temps les differentes phases qui permettent de transformer (dans un cadre de recherche d'information) la requete en langage naturel en une representation semantique independante du contexte. Des regles de simplification adaptees a la structure et au domaine du corpus sont ensuite appliquees, permettant d'obtenir une forme finale, adaptee a une conversion ver s un langage de requete formel. L'article decrit enfin les experimentations effectuees et tir e les premieres conclusions sur divers aspects de cette approche .

[1]  Norbert Fuhr,et al.  XIRQL: a query language for information retrieval in XML documents , 2001, SIGIR '01.

[2]  Scott Boag,et al.  XQuery 1.0 : An XML Query Language , 2007 .

[3]  Armin B. Cremers,et al.  Searching and browsing collections of structural information , 2000, Proceedings IEEE Advances in Digital Libraries 2000.

[4]  Mounia Lalmas,et al.  Advances in XML Information Retrieval: Third International Workshop of the Initiative for the Evaluation of XML Retrieval, INEX 2004, Dagstuhl Castle, ... 2004 (Lecture Notes in Computer Science) , 2005 .

[5]  Francis Jeffry Pelletier,et al.  Representation and Inference for Natural Language: A First Course in Computational Semantics , 2005, Computational Linguistics.

[6]  Uwe Reyle,et al.  From discourse to logic , 1993 .

[7]  Letizia Tanca,et al.  XML-GL: A Graphical Language for Querying and Restructuring XML Documents , 1999, SEBD.

[8]  Daniela Florescu,et al.  Quilt: An XML Query Language for Heterogeneous Data Sources , 2000, WebDB.

[9]  Mihaela Juganaru-Mathieu,et al.  Analysing Natural Language Queries at INEX 2004 , 2004, INEX.

[10]  Karen Sauvagnat XFIRM: un Modèle Flexible de Recherche d'Information pour le stockage et l'interrogation de documents XML. , 2004 .

[11]  E. Dura Natural Language in Information Retrieval , 2003, CICLing.

[12]  Avi Arampatzis,et al.  Linguistically Motivated Information Retrieval , 2000 .

[13]  Helmut Schmidt,et al.  Probabilistic part-of-speech tagging using decision trees , 1994 .

[14]  Tomek Strzalkowski,et al.  Evaluating Natural Language Processing Techniques in Information Retrieval , 1999 .

[15]  Gerhard Weikum,et al.  The Index-Based XXL Search Engine for Querying XML Data with Relevance Ranking , 2002, EDBT.

[16]  Alan F. Smeaton,et al.  Using NLP or NLP Resources for Information Retrieval Tasks , 1999 .

[17]  Karen Sparck Jones What is the Role of NLP in Text Retrieval , 1999 .

[18]  Thorsten Brants,et al.  Natural Language Processing in Information Retrieval , 2003, CLIN.