Construction et exploitation d'un corpus syntaxiquement annoté pour le français
暂无分享,去创建一个
Dans ce memoire, nous avons presente un corpus annote syntaxiquement pour le francais, pleinement desambiguise et valide manuellement. Ce travail est particulierement centre sur la methodologie mise en oeuvre lors de l'annotation semi-automatique de corpus et sur la description linguistique. L'annotation comprend l'assignation de traits ou categories a des unites textuelles, les "mots" dans une premiere etape, et la representation des constituances et dependances articulant des unites syntagmatiques dans une seconde etape. Cette seconde phase de l'annotation de corpus est en cours et souleve encore un certain nombre de problemes theoriques (comment annoter les dependances ambigues par exemple). L'annotation syntaxique comprend un ensemble de procedures qui ne sont pas sans influence sur la mise en lumiere de certains phenomenes linguistiques lors de l'exploitation du corpus. . .