Une approche hybride de l'extraction d'information : sous-langages et lexique-grammaire/
暂无分享,去创建一个
L'extraction d'information consiste habituellement a remplir, au depart d'un ensemble de documents, les champs d'un formulaire prealablement etabli et articule autour d'un scenario precis. Dans ce travail, nous cherchons a etudier la pertinence des bases de donnees syntaxiques du lexique-grammaire afin de repondre aux questions et enjeux poses par ce domaine d'application (adaptabilite, performance,...). La phrase elementaire (couple ) est l'unite significative minimale de cette theorie linguistique (M. Gross, 1975) qui reunit lexique et syntaxe en un unique formalisme. Chacune de ces phrases dessine le sens d'un predicat au moyen de criteres tant distributionnels que transformationnels. Dans un cadre generique, on ne peut malheureusement pas pretendre caracteriser davantage ces phrases. Il convient en effet que l'analyse syntaxico-semantique qui derive de l'utilisation du formalisme s'adapte a toute situation d'enonciation. Toutefois, si on limite l'analyse dont il est question a un contexte ou sous-langage particulier, celui d'un scenario d'extraction par exemple, en d'autres termes, si nous bornons la situation d'enonciation, il est envisageable de preciser la semantique du predicat et de ses complements essentiels. Les phrases elementaires peuvent ainsi etre apprehendees comme autant de motifs d'extraction.