Éléments pour un système de reconnaissance de contextes thématiques dans l'exploration d'un corpus textuel
暂无分享,去创建一个
L'etude se situe dans le cadre de l'analyse et de l'exploration du texte assistee par ordinateur. Les bases de donnees textuelles, notamment Frantext, se limitent habituellement au simple acces a des structures de surface: on propose ici les elements d'une base de connaissances lexicologique thematique qui doit permettre d'explorer en partie des structures profondes par la reconnaissance automatique de vocables conceptuellement associables. Cette base, evolutive, sera regulierement alimentee par les listes que fournissent les rubriques analogiques des dictionnaires, les etudes particulieres a un concept et surtout l'exploration contextuelle semi-automatisee de corpus specifiques constamment completes: des criteres semantique, stylistiques et chronologiques seront pris en compte, et affiches dans des menus a options multiples qui devront garantir la meilleure adequation possible des resultats a la requete. Le probleme se pose du mode de reperage, et de l'obstacle que constituent la polysemie et l'holographie. La collecte des correlats pertinents suscite un certain nombre de remarques de type methodologique impliquant notamment l'examen des relations qui lient virtuellement les signifies. Couplee a un logiciel d'exploration du plein-texte, la base ainsi constituee devra permettre d'obtenir en temps reel des collections de contextes (citations, exemples, attestations) centrees autour d'un theme donne. Une simulation a partir du concept "ennui" donne un premier apercu de la demarche.