Méthodologie linguistique et terminologique pour la structuration d'ontologies différentielles à partir de corpus textuels

Des ressources telles que les terminologies ou les ontologies sont utilisees dans differentes applications, notamment dans la description documentaire et la recherche d'information. Differentes methodologies ont ete proposees pour construire ce type de ressources, que ce soit a partir d'entrevues avec des experts du domaine ou a partir de corpus textuels. Nous nous interessons dans ce memoire a l'utilisation de methodologies existantes dans le domaine du Traitement Automatique des Langues, destinees a la construction d'ontologies a partir de corpus textuels, pour la construction d'un type de ressource particulier : des ontologies differentielles. Ces ontologies sont structurees selon un systeme d'identite et de difference semantique entre leurs constituants : les termes du domaine et des categories dites "de haut niveau". Nous presentons differentes experimentations qui ont ete menees pour eliciter, structurer, definir et interdefinir les elements terminologiques pertinents a la realisation d'une tâche particuliere. Notre premier contexte applicatif a ete le projet OPALES, et nous devions fournir a des nthropologue le vocabulaire conceptuel destine a annoter des documents audiovisuels traitant de la petite enfance. Nous nous sommes servie du corpus constitue a cette occasion pour tester les methodologies et outils linguistiques proposes pour l'aide a la construction d'ontologie, et avons defini notre propre chaine de traitement. Celle-ci, appellee SODA, est basee sur l'extraction et l'exploitation d'enonces definitoires en corpus pour reperer des elements terminologiques, les structurer et donner des elements de communaute semantique permettant de les comparer.

[1]  Marie-Laure Mugnier,et al.  Conceptual Structures: Theory, Tools and Applications , 1998, Lecture Notes in Computer Science.

[2]  Dirk Geeraerts,et al.  The structure of lexical variation: Meaning, naming, and context , 1994 .

[3]  Asunción Gómez-Pérez,et al.  Ontological Engineering: With Examples from the Areas of Knowledge Management, e-Commerce and the Semantic Web , 2004, Advanced Information and Knowledge Processing.

[4]  Audrey Baneyx,et al.  Synergie entre analyse distributionnelle et patrons lexico-syntaxiques pour la construction d'ontologies différentielles , 2005 .

[5]  Pierre Zweigenbaum,et al.  Recherche en corpus de réponses à des questions définitoires , 2005, JEPTALNRECITAL.

[6]  Nathalie Aussenac-Gilles,et al.  Modélisation du domaine par une méthode fondée sur l'analyse de corpus , 2000 .

[7]  Natalia Grabar,et al.  Construire un corpus Web pour l'acquisition terminologique , 2001 .

[8]  P. Séguéla,et al.  Extraction de relations sémantiques entre termes et enrichissement de modèles du domaine , 1999 .

[9]  Repérage et exploitation d’énoncés définitoires en corpus pour l’aide à la construction d’ontologie , 2004, JEPTALNRECITAL.

[10]  Ludovic Lebart,et al.  Analyse statistique des donnees textuelles : questions ouvertes et lexicométrie , 1988 .

[11]  Gilles Bisson,et al.  Aide à la conception de méthodes de classification pour la construction d'ontologies : l'atelier Mo'K , 2001, EGC.

[12]  Didier Bourigault,et al.  Analyse distributionnelle et structuration de terminologie : Application à la construction d'une ontologie documentaire du Droit , 2002 .

[13]  M. Gribaudo,et al.  2002 , 2001, Cell and Tissue Research.

[14]  Raphaël Troncy,et al.  DOE : une mise en oeuvre d'une méthode de structuration différentielle pour les ontologies , 2002 .

[15]  Mats Rooth,et al.  Structural Ambiguity and Lexical Relations , 1991, ACL.

[16]  W. Bruce Croft,et al.  Deriving concept hierarchies from text , 1999, SIGIR '99.

[17]  Steffen Staab,et al.  Learning Taxonomic Relations from Heterogeneous Evidence , 2004 .

[18]  Smaranda Muresan,et al.  A Method for Automatically Building and Evaluating Dictionary Resources , 2002, LREC.

[19]  Christian Jacquemin,et al.  Term Extraction + Term Clustering: An Integrated Platform for Computer-Aided Terminology , 1999, EACL.

[20]  James R. Curran,et al.  Scaling Context Space , 2002, ACL.

[21]  Thierry Hamon,et al.  Structuration de terminologie: quels outils pour quelles pratiques ? , 2002 .

[22]  David Genest,et al.  A Platform Allowing Typed Nested Graphs: How CoGITo Became CoGITaNT (Research Note) , 1998, ICCS.

[23]  양희영 2005 , 2005, Los 25 años de la OMC: Una retrospectiva fotográfica.

[24]  Natalia Grabar,et al.  Liens morphologiques et structuration de terminologie , 2000 .

[25]  Nathalie Aussenac-Gilles,et al.  Structuration de terminologies à l'aide d'outils de TAL avec TERMINAE , 2002 .

[26]  A. Piperno,et al.  2003 , 2003, Intensive Care Medicine.

[27]  Ruslan Mitkov,et al.  The Oxford handbook of computational linguistics , 2003 .

[28]  Natalia Grabar,et al.  Les relations dans les terminologies structurées : de la théorie à la pratique , 2004, Rev. d'Intelligence Artif..

[29]  Stéfan Jacques Darmoni,et al.  An assessment of the visibility of MeSH-indexed medical web catalogs through search engines , 2002, AMIA.

[30]  Pierre Zweigenbaum,et al.  Detecting Semantic Relations between Terms in Definitions , 2004 .

[32]  James A. Hendler,et al.  The Semantic Web: A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities , 2001 .

[33]  Jean Charlet,et al.  Construction de ressources terminologiques ou ontologiques à partir de textes Un cadre unificateur pour trois études de cas , 2004, Rev. d'Intelligence Artif..

[34]  Raphael Troncy Le raisonnement dans les descriptions documentaires: l'apport de la représentation des connaissances , 2003 .

[35]  Benoît Habert,et al.  Le péritexte, un sésame pour les données audiovisuelles ? L'analyse exploratoire d'un corpus hétérogène de notices documentaires interprétant des documents audiovisuels , 2000 .

[36]  Didier Bourigault,et al.  Acquisition et évaluation sur corpus de propriétés de sous-catégorisation syntaxique , 2005, JEPTALNRECITAL.

[37]  Paola Velardi,et al.  Using text processing techniques to automatically enrich a domain ontology , 2001, FOIS.

[38]  Atanas Kiryakov,et al.  OntoMap: portal for upper-level ontologies , 2001, FOIS.

[39]  L. Miles,et al.  2000 , 2000, RDH.

[40]  N. Grabar,et al.  Repérage de relations terminologiques transversales en corpus , 2004, JEPTALNRECITAL.

[41]  Pierre Zweigenbaum,et al.  Acquiring meaning for French medical terminology: contribution of morphosemantics , 2004, MedInfo.