Une architecture de services pour mieux spécialiser les processus d’acquisition terminologique [A service architecture for better specialization of terminology acquisition processes]

L'acquisition terminologique est souvent consideree comme une technologie proche de la maturite dans les domaines du traitement automatique des langues et de l'ingenierie des connaissances. Elle peut jouer un role essentiel dans la constitution de lexiques specialises pour la recherche d'information et pour diverses applications du TAL. Il existe des outils robustes pour realiser les tâches centrales de ce processus d'acquisition de ressources a partir de corpus. Cependant, mettre en place un assemblage coherent d'outils pour supporter un processus aussi etendu reste une entreprise difficile, et les concepteurs ne peuvent guere prendre appui sur des architectures de reference. Le besoin de reperes, tant methodologiques que logiciels, est d'autant plus sensible que la nature meme de l'acquisition terminologique requiert la mise en place de chaines de traitement facilement reconfigurables. Pour repondre a ces besoins, nous proposons une architecture de services ou chaque application est concue par reutilisation de services generiques et adaptation de services dedies a des tâches plus sensibles au contexte de l'application. Ce cadre structurant est mis en œuvre dans la plateforme d'acquisition HyperTerm, et nous montrons comment il a ete exploite pour integrer l'extracteur de termes ACABIT.

[1]  Anne Condamines,et al.  Corpus analysis and conceptual relation patterns , 2002 .

[2]  André Salem Pratique des segments répétés : essai de statistique textuelle , 1987 .

[3]  Béatrice Daille,et al.  Variations and application-oriented terminology engineering , 2005 .

[4]  Christian Biemann,et al.  Web Services for Language Resources and Language Technology Applications , 2004, LREC.

[5]  Pierre Zweigenbaum,et al.  Acquiring meaning for French medical terminology: contribution of morphosemantics , 2004, MedInfo.

[6]  Béatrice Daille Conceptual Structuring through Term Variations , 2003, ACL 2003.

[7]  Farid Cerbah,et al.  Exogeneous and Endogeneous Approaches to Semantic Categorization of Unknown Technical Terms , 2000, COLING.

[8]  Slava M. Katz,et al.  Technical terminology: some linguistic properties and an algorithm for identification in text , 1995, Natural Language Engineering.

[9]  M. Teresa Cabré Castellví,et al.  Automatic term detection: A review of current systems , 2001 .

[10]  Antoine Widlöcher Analyse par contraintes de l’organisation du discours , 2006, JEPTALNRECITAL.

[11]  Xavier Polanco,et al.  Evaluation d'une plate-forme d'indexation de termes complexes , 2000 .

[12]  Rémi Zajac,et al.  An Open Distributed Architecture for Reuse and Integration of Heterogeneous NLP Components , 1997, ANLP.

[13]  Nigel Collier,et al.  Introduction to the Bio-entity Recognition Task at JNLPBA , 2004, NLPBA/BioNLP.

[14]  Denyse Baillargeon,et al.  Bibliographie , 1929 .

[15]  Annie Tartier,et al.  Analyse automatique de l'évolution terminologique : variations et distances , 2004 .

[16]  David A. Ferrucci,et al.  UIMA: an architectural approach to unstructured information processing in the corporate research environment , 2004, Natural Language Engineering.

[17]  Fiammetta Namer Morphosémantique pour l'appariement de termes dans le vocabulaire médical : Approche multilingue , 2005 .

[18]  Fiammetta Namer FLEMM : Un analyseur flexionnel du français à base de règles , 2000 .

[19]  Xavier Polanco,et al.  In vitro evaluation of a program for machine-aided indexing , 2002, Inf. Process. Manag..

[20]  Adeline Nazarenko,et al.  Building back-of-the-book indexes , 2005 .

[21]  Kalina Bontcheva,et al.  Web Services Architecture for Language Resources , 2004, LREC.

[22]  Nathalie Aussenac-Gilles,et al.  Les relations sémantiques: du linguistique au formel , 2000 .

[23]  HAMISH CUNNINGHAM,et al.  Software architecture for language engineering , 2000 .

[24]  Patrick Drouin,et al.  Term extraction using non-technical corpora as a point of leverage , 2003 .

[25]  Y. Wilks,et al.  A General Architecture for Text Engineering (gate) { a New Approach to Language Engineering R&d a General Architecture for Text Engineering (gate) | a New Approach to Language Engineering R&d a E G T , 1995 .

[26]  Nancy Ide,et al.  Standards for Language Resources , 2002, LREC.

[27]  J. Veronis,et al.  Etiquetage grammatical multilingue : le projet MULTEXT , 1995 .

[28]  Marc Moens,et al.  XML Tools And Architecture for Named Entity Recognition , 1999, Markup Lang..

[29]  Hamish Cunningham,et al.  GATE-a General Architecture for Text Engineering , 1996, COLING.

[30]  Marie-Claude LHomme,et al.  A Lexico-semantic Approach to the Structuring of Terminology , 2004, CompuTerm International Workshop On Computational Terminology.

[31]  Thierry Hamon,et al.  Detection of synonymy links between terms: experiment and results , 2001 .

[32]  Roberto Basili,et al.  Engineering of IE Systems: An Object-Oriented Approach , 1999, SCIE.

[33]  Ashwani Kumar,et al.  Miamm — A Multimodal Dialogue System Using Haptics , 2005 .

[34]  Antoine Widlöcher,et al.  La plate-forme LinguaStream : un outil d'exploration linguistique sur corpus , 2005 .