论文信息 - Peuplement d'une base de connaissance par annotation automatique de textes relatifs à la cosmétique

Peuplement d'une base de connaissance par annotation automatique de textes relatifs à la cosmétique

Dans cet article, nous proposons une approche pour construire une base de connaissances a partir de textes dans le domaine de la cosmetique. Il s’agit d’un cas particulier pour un domaine fixe du probleme de l’extraction de relations a partir de textes. Dans le but de resoudre ce probleme, nous proposons une approche semi-supervisee pour l’extraction des relations en combinant deux methodes : (i) la construction de patrons d’extraction a partir des resumes presents dans les pages de DBpedia, (ii) l’annotation manuelle d’un ensemble de textes pour definir des patrons syntaxiques pour extraire les relations. Nous avons evalue notre approche sur deux types de corpus : (i) un premier corpus est compose d’articles de journaux specialises, tels que au feminin. com et Cosmetique Hebdo, (ii) un deuxieme corpus est constitue d’un ensemble de phrases collectees sur sur le Web.

[1] D. Gerber,et al. Bootstrapping the Linked Data Web , 2011 .

[2] Fabien L. Gandon,et al. ProVoc : une ontologie pour décrire des produits sur le Web , 2016, IC.

[3] Frédérique Segond,et al. Generating a Resource for Products and Brandnames Recognition. Application to the Cosmetic Domain. , 2014, LREC.

[4] Kundan Kumar,et al. Constructing knowledge graph from unstructured text , 2015 .

[5] Martin Hepp,et al. GoodRelations: An Ontology for Describing Products and Services Offers on the Web , 2008, EKAW.

[6] Kamel Nebhi,et al. A Rule-Based Relation Extraction System using DBpedia and Syntactic Parsing , 2013, NLP-DBPEDIA@ISWC.

[7] Sebastian Hellmann,et al. Real-Time RDF Extraction from Unstructured Data Streams , 2013, SEMWEB.