SMILK, trait d'union entre langue naturelle et données sur le web

Le laboratoire commun SMILK avait pour double sujet d'etude l'utilisation du traitement automatique du langage naturel pour aider a la construction et au liage de donnees sur le web et, a l'inverse, l'utilisation de ces donnees liees du web semantique pour aider a l'analyse des textes et venir en appui de l'extraction de connaissances et l'annotation de contenus textuels. L'evaluation de nos travaux s'est focalisee sur la recherche d'informations portant sur des marques, plus particulierement dans le domaine de la cosmetique. Cet article decrit chaque etape de notre approche : la conception de ProVoc, une ontologie pour decrire les produits et marques ; le peuplement automatique d'une base de connaissances reposant notamment sur ProVoc a partir de ressources textuelles heterogenes; et l'evaluation d'une application prenant la forme d'un plugin de navigateur proposant des connaissances supplementaires aux utilisateurs naviguant sur le web.

[1]  Jos de Bruijn,et al.  GenTax: A Generic Methodology for Deriving OWL and RDF-S Ontologies from Hierarchical Classifications, Thesauri, and Inconsistent Taxonomies , 2007, ESWC.

[2]  Salvatore Orlando,et al.  Dexter: an open source framework for entity linking , 2013, ESAIR '13.

[3]  Stefan Rude Methodology of Design , 1991 .

[4]  Elena Cabrio,et al.  Extraction de relations pour le peuplement d'une base de connaissance à partir de tweets , 2017, EGC.

[5]  Chantal Reynaud,et al.  Peuplement automatique d'ontologie à partir d'un catalogue de produits , 2014, IC.

[6]  Kamel Nebhi,et al.  A Rule-Based Relation Extraction System using DBpedia and Syntactic Parsing , 2013, NLP-DBPEDIA@ISWC.

[7]  Sebastian Hellmann,et al.  Real-Time RDF Extraction from Unstructured Data Streams , 2013, SEMWEB.

[8]  Fabien L. Gandon,et al.  Adapting Semantic Spreading Activation to Entity Linking in Text , 2016, NLDB.

[9]  Frédérique Segond,et al.  Generating a Resource for Products and Brandnames Recognition. Application to the Cosmetic Domain. , 2014, LREC.

[10]  Marti A. Hearst Automatic Acquisition of Hyponyms from Large Text Corpora , 1992, COLING.

[11]  Michael Gruninger,et al.  Methodology for the Design and Evaluation of Ontologies , 1995, IJCAI 1995.

[12]  Martin Hepp,et al.  GoodRelations: An Ontology for Describing Products and Services Offers on the Web , 2008, EKAW.

[13]  J. Minel,et al.  Annotation documentaire et peuplement d'ontologie à partir d'extractions linguistiques , 2005 .

[14]  Atanas Kiryakov,et al.  Semantic Annotation, Indexing, and Retrieval , 2003, SEMWEB.

[15]  David D. McDonald Internal and External Evidence in the Identification and Semantic Categorization of Proper Names , 1993 .

[16]  Kundan Kumar,et al.  Constructing knowledge graph from unstructured text , 2015 .

[17]  Catherine Faron-Zucker,et al.  Peuplement d'une base de connaissance par annotation automatique de textes relatifs à la cosmétique , 2017, IC.

[18]  Fabien L. Gandon,et al.  Du TALN au LOD : Extraction d'entités, liage, et visualisation , 2016, IC.

[19]  Michael Uschold,et al.  Ontologies: principles, methods and applications , 1996, The Knowledge Engineering Review.

[20]  Richard Cyganiak,et al.  Open eBusiness Ontology Usage: Investigating Community Implementation of GoodRelations , 2011, LDOW.

[21]  Assaf Urieli,et al.  Robust French syntax analysis: reconciling statistical methods and linguistic knowledge in the Talismane toolkit. (Analyse syntaxique robuste du français : concilier méthodes statistiques et connaissances linguistiques dans l'outil Talismane) , 2013 .

[22]  Fabien L. Gandon,et al.  ProVoc : une ontologie pour décrire des produits sur le Web , 2016, IC.