Un modèle d'analyseur synthaxique robuste fondé sur la modularité et la lexicalisation de ses grammaires
暂无分享,去创建一个
Les analyseurs syntaxiques robustes associent automatiquement a la chaine decoupee en unites une representation des groupements structurels et des relations fonctionnelles existant entre ces unites. L'enjeu auquel ces analyseurs se heurtent est souvent le maintien d'un equilibre entre la finesse de la description linguistique et l'efficacite de l'analyseur, ainsi qu'entre cette finesse descriptive et son adequation empirique. Il existe un bon nombre de phenomenes mal modelises ou pas modelises du tout par les analyseurs existants, parce qu'il s'agit soit de phenomenes peu frequents dans les corpus ge��neralement utilises pour le developpement des analyseurs (modalites de l'oral, des instructions), soit de phenomenes ayant trait a la structure et a la visualisation des documents (marques typo-dispositionnelles), soit des structures requerant des techniques de traitement au dela de la syntaxe stricte (rattachement de groupes prepositionnels). Tous ces aspects nous amene a proposer et a implementer une architecture pour un analyseur robuste capable de traiter du texte libre de differents domaines avec une couverture et une precision elevees et homogenes. Notre modele d'analyseur s'articule ainsi autour de deux notions fondamentales: d'une part une specialisation et une strategie d'application modulaire des grammaires pour le traitement precis des corpus heterogenes et, d'autre part, une lexicalisation des grammaires de dependance (combinaison de la grammaire symbolique avec un mecanisme d'apprentissage non-supervise) pour une meilleure resolution des ambiguites structurelles liees au rattachement prepositionnel.