Analyse automatique de corpus avec INTEX

INTEX est un logiciel de traitement de corpus fonde sur l'utilisation de dictionnaires electroniques a large couverture. INTEX peut etre utilise pour analyser des textes de plusieurs dizaines de millions de mots. INTEX contient plusieurs dictionnaires et grammaires representees par des graphes a etats finis ; l'utilisateur peut ajouter ses propres dictionnaires et grammaires. Ces outils linguistiques sont appliques a des textes pour retrouver des structures morpho-syntaxiques, lever des ambiguites, etiqueter des mots simples ainsi que des expressions figees. INTEX permet de construire des concordances et des index lemmatises pour des structures syntaxiques diverses ; il est utilise par des linguistes pour analyser des corpus, mais peut etre vu aussi comme un logiciel de documentation automatique.