TXM : Une plateforme logicielle open-source pour la textométrie - conception et développement

Le projet de recherche Federation des recherches et developpements en textometrie autour de la creation d'une plateforme logicielle ouverte diffuse sa plateforme d'analyse textometrique de corpus XML-TEI en ligne. La conception de cette plateforme repose sur une synthese des fonctionnalites des logiciels de textometrie existants. Elle s'appuie sur le recensement des technologies logicielles open-source disponibles et efficaces pour manipuler des ressources numeriques XML et Unicode, et sur un etat de l'art des moteurs de recherche en texte integral sur corpus structures et etiquetes. L'architecture consiste en une boite a outils Java articulant un composant moteur de recherche (IMS CWB), un environnement de calcul statistique (R) et un module d'importation de corpus XML-TEI. La plateforme est diffusee sous la forme d'une boite a outils en open-source pour les developpeurs informatique mais egalement sous la forme de deux applications pour les utilisateurs finaux de la textometrie : une application a installer sur un poste local (Windows ou Linux) et une application web accessible en ligne. Encore au debut de son developpement, la plateforme n'implemente a l'heure actuelle que quelques fonctionnalites essentielles, mais sa diffusion en open-source autorise un developpement communautaire ouvert. Cela doit faciliter son evolution et l'integration de nouveaux modeles et methodes.