Choix des conclusions et validation des règles issues d'arbres de classification

Resume. Cet article traite de la validation de regles dans un contexte de ciblage ou il s’agit de determiner les profils type des differentes valeurs de la variable a predire. Les concepts de l’analyse statistique implicative fondee sur la difference entre nombre observe de contre-exemples et nombre moyen que produirait le hasard, s’averent particulierement bien adaptes a ce contexte. Le papier montre comment les notions d’indice et d’intensite d’implication de Gras s’appliquent aux regles produites par les arbres de decision et presente des alternatives inspirees de residus utilises en modelisation de tables de contingence. Nous discutons ensuite sur un jeu de donnees reelles deux usages de ces indicateurs de force d’implication pour les regles issues d’arbres. Il s’agit d’une part de l’evaluation individuelle des regles, et d’autre part de leur utilisation comme critere pour le choix de la conclusion de la regle.