Cartes dynamiques interactives : une metaphore spatiale pour l'exploration des espaces informationnels

Depuis quelques annees, le nombre de documents informatises peu structures diffuses par des serveurs d'informations divers (news, wais, gopher, www, etc. ) a augmente considerablement. Cette situation rend difficile la recherche et le filtrage des documents. En particulier, la recherche et le filtrage par theme est l'un des types de recherche les moins bien maitrises. Dans cette these nous nous interessons a ce probleme de deux points de vues differents et complementaires: l'interface homme-machine et l'analyse plein texte de collections de documents. Le paradigme d'interaction que nous proposons repose sur une metaphore spatiale. Il est fonde sur le concept de cartes dynamiques interactives. Les collections de documents consultees sont considerees comme des espaces contenant des ressources diverses, des villes et des chemins. Les cartes constituent des representations graphiques synthetiques et deformables de ces espaces. Elles permettent une exploration visuelle rapide et donnent des points de reperes indispensables pour l'exploration de vastes espaces d'informations. Le recours a la metaphore spatiale guide leur conception et permet d'en rendre l'utilisation et la manipulation intuitives. Il existe plusieurs types de cartes. Les cartes de documents representent des sous-ensembles de documents alors que les cartes semantiques representent l'ensemble des themes abordes dans les documents presents. Des cartes mixtes representent a la fois des themes et des documents. Dans tous les cas des strategies automatiques de placement et d'occupation de la surface ainsi que des mecanismes d'interaction pour la navigation et l'exploration des espaces sous-jacents sont proposes. La construction des cartes semantiques repose sur l'extraction d'une semantique des espaces d'information consideres. Pour ce faire, nous proposons des procedes qui reposent sur l'analyse plein-texte des documents et qui permettent d'extraire de maniere semi-automatique une terminologie pertinente sur laquelle s'appuient les mecanismes d'indexation automatique. Un travail supplementaire de classification automatique est ensuite effectue sur cette terminologie pour permettre la construction d'un thesaurus. Les cartes semantiques qui presentent l'ensemble des themes abordes dans la collection visitee sont construites a partir de ce thesaurus. Le langage de requete graphique que nous proposons s'appuie egalement sur ce thesaurus. Enfin, les cartes ne sont pas seulement des vues exploitables pour la navigation et l'exploration des espaces d'information, elles ont egalement un statut de document. A ce titre elles peuvent etre partagees entre utilisateurs et enrichies avec le temps par les reperes multiples que les utilisateurs ajoutent. Ainsi, la re-utilisation des cartes et la cooperation entre utilisateurs peuvent permettre d'aboutir a une meilleure connaissance des espaces d'information et a faciliter a terme l'exploration et l'organisation de ces espaces