Peuplement d'une base de connaissance par annotation automatique de textes relatifs à la cosmétique

Dans cet article, nous proposons une approche pour construire une base de connaissances a partir de textes dans le domaine de la cosmetique. Il s’agit d’un cas particulier pour un domaine fixe du probleme de l’extraction de relations a partir de textes. Dans le but de resoudre ce probleme, nous proposons une approche semi-supervisee pour l’extraction des relations en combinant deux methodes : (i) la construction de patrons d’extraction a partir des resumes presents dans les pages de DBpedia, (ii) l’annotation manuelle d’un ensemble de textes pour definir des patrons syntaxiques pour extraire les relations. Nous avons evalue notre approche sur deux types de corpus : (i) un premier corpus est compose d’articles de journaux specialises, tels que au feminin. com et Cosmetique Hebdo, (ii) un deuxieme corpus est constitue d’un ensemble de phrases collectees sur sur le Web.