TXM : Une plateforme logicielle open-source pour la textométrie - conception et développement
暂无分享,去创建一个
Le projet de recherche Federation des recherches et developpements en textometrie autour de la creation d'une plateforme logicielle ouverte diffuse sa plateforme d'analyse textometrique de corpus XML-TEI en ligne. La conception de cette plateforme repose sur une synthese des fonctionnalites des logiciels de textometrie existants. Elle s'appuie sur le recensement des technologies logicielles open-source disponibles et efficaces pour manipuler des ressources numeriques XML et Unicode, et sur un etat de l'art des moteurs de recherche en texte integral sur corpus structures et etiquetes. L'architecture consiste en une boite a outils Java articulant un composant moteur de recherche (IMS CWB), un environnement de calcul statistique (R) et un module d'importation de corpus XML-TEI. La plateforme est diffusee sous la forme d'une boite a outils en open-source pour les developpeurs informatique mais egalement sous la forme de deux applications pour les utilisateurs finaux de la textometrie : une application a installer sur un poste local (Windows ou Linux) et une application web accessible en ligne. Encore au debut de son developpement, la plateforme n'implemente a l'heure actuelle que quelques fonctionnalites essentielles, mais sa diffusion en open-source autorise un developpement communautaire ouvert. Cela doit faciliter son evolution et l'integration de nouveaux modeles et methodes.
[1] Oliver Christ,et al. A Modular and Flexible Architecture for an Integrated Corpus Query System , 1994, ArXiv.
[2] Lexicométrie sur corpus étiquetés , 2004 .
[3] Serge Heiden. Un modèle de données pour la textométrie : contribution à une interopérabilité entre outils , 2006 .
[4] Modélisation textométrique des textes , 2008 .