Optimisation de requetes dans un Systeme de recherche d'informationapproche basee sur L'exploitation de Techniques Avancees de L'algorithmique Genetique

Les travaux presentes dans cette these traitent des apports de l'algorithmique genetique a la conception de systemes de recherche d'information adaptatifs aux besoins des utilisateurs. Notre etude se focalise en premier lieu, sur l'analyse des differents modeles et strategies de representation et de recherche d'information. Nous mettons notamment en evidence, leur contribution a la resolution des problemes inherents a la recherche d'information. En second lieu, notre interet s'est porte sur l'etude des algorithmes genetiques. Nous basant alors sur leur robustesse, theoriquement et experimentalement prouvee, nous integrons ces algorithmes a la mise en oeuvre de notre approche d'optimisation de requete. Nous presentons une approche de recherche d'information qui integre une strategie de reformulation de requete par injection de pertinence, fondee sur l'hybridation d'un processus d'optimisation genetique, a un modele de recherche de base. Nous proposons un algorithme specifique a la recherche d'information, par l'integration d'operateurs genetiques augmentes par la connaissance du domaine d'une part, et d'une heuristique permettant de resoudre le probleme de multimodalite de la pertinence d'autre part. L'heuristique de nichage en l'occurrence, est diffusee globalement lors de l'evolution de l'AG. La population est alors organisee en niches de requetes effectuant une recherche parallele et cooperative d'informations. Nous evaluons enfin notre approche de recherche d'information, au travers d'experimentations realisees a l'aide du systeme Mercure, sur la collection de reference TREC.

[1]  Shyi-Ming Chen,et al.  Document retrieval using knowledge-based fuzzy information retrieval techniques , 1995, IEEE Trans. Syst. Man Cybern..

[2]  Gerard Salton,et al.  Research and Development in Information Retrieval , 1982, Lecture Notes in Computer Science.

[3]  William E. Hart,et al.  Optimizing an Arbitrary Function is Hard for the Genetic Algorithm , 1991 .

[4]  Gerard Salton,et al.  The SMART Retrieval System—Experiments in Automatic Document Processing , 1971 .

[5]  W. Bruce Croft,et al.  Query expansion using local and global document analysis , 1996, SIGIR '96.

[6]  Michael D. Gordon Probabilistic and genetic algorithms in document retrieval , 1988, CACM.

[7]  Carol A. Ankenbrandt An Extension to the Theory of Convergence and a Proof of the Time Complexity of Genetic Algorithms , 1990, FOGA.

[8]  Pedro Hípola G. Salton, Automatic text processing: The Transformation Analysis and Retrieval of Information by Computer , 1991 .

[9]  David B. Fogel,et al.  Toward a New Philosophy of Machine Intelligence , 2000 .

[10]  Jianying Wang,et al.  Corpus Analysis for TREC 5 Query Expansion , 1996, TREC.

[11]  Hsinchun Chen,et al.  Machine Learning for Information Retrieval: Neural Networks, Symbolic Learning, and Genetic Algorithms , 1995, J. Am. Soc. Inf. Sci..

[12]  Garrison W. Cottrell,et al.  Automatic combination of multiple ranked retrieval systems , 1994, SIGIR '94.

[13]  Lawrence J. Fogel,et al.  Artificial Intelligence through Simulated Evolution , 1966 .

[14]  Alex A. Freitas,et al.  A Genetic Algorithm for Generalized Rule Induction , 1999 .

[15]  Peter Willett,et al.  The limitations of term co-occurrence data for query expansion in document retrieval systems , 1991, J. Am. Soc. Inf. Sci..

[16]  Kui-Lam Kwok,et al.  A network approach to probabilistic information retrieval , 1995, TOIS.

[17]  Cyril Fonlupt,et al.  The fitness function and its impact on local search methods , 1998, SMC'98 Conference Proceedings. 1998 IEEE International Conference on Systems, Man, and Cybernetics (Cat. No.98CH36218).

[18]  W. Bruce Croft,et al.  Evaluation of an inference network-based retrieval model , 1991, TOIS.

[19]  Edward Fox,et al.  Extending the boolean and vector space models of information retrieval with p-norm queries and multiple concept types , 1983 .

[20]  R. Cerf Une théorie asymptotique des algorithmes génétiques , 1994 .

[21]  James Allan,et al.  Approaches to passage retrieval in full text information systems , 1993, SIGIR.

[22]  James E. Baker,et al.  Adaptive Selection Methods for Genetic Algorithms , 1985, International Conference on Genetic Algorithms.

[23]  James P. Callan,et al.  Passage-level evidence in document retrieval , 1994, SIGIR '94.

[24]  Carolyn J. Crouch,et al.  Experiments in automatic statistical thesaurus construction , 1992, SIGIR '92.

[25]  Stephen E. Robertson,et al.  On relevance weights with little relevance information , 1997, SIGIR '97.

[26]  R. Rosenberg Simulation of genetic populations with biochemical properties : technical report , 1967 .

[27]  Takenobu Tokunaga,et al.  Combining multiple evidence from different types of thesaurus for query expansion , 1999, SIGIR '99.

[28]  Hugo Zaragoza,et al.  Information Retrieval: Algorithms and Heuristics , 2002, Information Retrieval.

[29]  Donald H. Kraft,et al.  Applying Genetic Algorithms to Information Retrieval Systems Via Relevance Feedback , 1995 .

[30]  Claudio Carpineto,et al.  Information Term Selection for Automatic Query Expansion , 1998, TREC.

[31]  David E. Goldberg,et al.  Genetic Algorithms with Sharing for Multimodalfunction Optimization , 1987, ICGA.

[32]  Chris Buckley,et al.  Improving automatic query expansion , 1998, SIGIR '98.