Data Mining et analyse des CV : une expérience et des perspectives
暂无分享,去创建一个
La problematique que nous abordons dans cet article est l'elaboration de modeles permettant la detection automatique des curriculum vitre (CV) de cadres au sein d'un corpus constitue a plus de 90% par des CV de non cadres. Le CV est un document textuel singulier: faible structure, informations eparses, contenu fortement symbolique, etc. d'ou la difficulte de traitement de ces documents. Dans un premier temps, nous essayons de definir, par des techniques de selection et construction de variables, un nombre restreint de descripteurs standards des documents textuels. Nous utilisons cet espace ainsi defini pour modeliser le ciblage par apprentissage supervise. En utilisant des methodes d'arbres d'induction et analyse discriminante, nous obtenons des resultats interessants en apprentissage (86% de rappel et 88% de precision). Meme si les resultats en validation peuvent paraitre decevants (55% de rappel et 60% de precision), cette approche ouvre des perspectives interessantes d'exploitation automatique de CV basee sur le contenu informationnel et non a partir de simples mots clefs.