Extraction et capitalisation automatiques de connaissances à partir de documents textuels : Seek-Java : identification et interprétation de relations entre concepts

Le travail presente dans cette these se situe a la frontiere de plusieurs domaines : informatique, extraction d'information, acquisition de connaissances, terminologie et linguistique. A partir de conceptualisations semantiques elaborees dans le cadre d'un modele general de traitement des langues en rapport avec la cognition, le modele de la grammaire applicative et cognitive (GAC), un premier systeme automatique a ete realise en 1993 (jouis 93) : seek. La presente etude a repris certaines des analyses deja presentees dans seek mais notre effort a porte d'une part, sur une reanalyse et une reorganisation des connaissances linguistiques et d'autre part, sur une nouvelle modelisation faisant usage des potentialites offertes par le langage java de facon a integrer le modele de la GAC dans une plate-forme appelee filtext et sa realisation informatique contexto. Le systeme seek-java identifie et interprete des relations entre concepts a partir du traitement automatique de textes et fournit les resultats a la fois sous forme de graphes et d'une base de donnees.