Traitement des donnees volumineuses. Mesures et algorithmes d'extraction de regles d'association et regles ordinales
暂无分享,去创建一个
L'etude proposee concerne les mesures et les algorithmes d'extraction automatiques de regles d'association et de regles ordinales pour des donnees volumineuses. Pour l'extraction de regles d'association, une etude sur les mesures est menee afin d'obtenir des regles interessantes. L'association de trois mesures permet de repondre a cette preoccupation. La premiere, la probabilite conditionnelle, mesure la precision de la regle. La seconde, l'intensite d'implication, evalue le caractere significatif de la regle en nous indiquant si le nombre de contre-exemples observe est significativement faible par rapport a ce que l'on obtiendrait si par hypothese la premisse et la conclusion de la regle etaient independantes. La troisieme, une mesure probabiliste, est proposee et elle mesure la robustesse de la regle c'est-a-dire la proportion de contre-exemples necessaires pour que la regle devienne invalide. Un algorithme d'extraction de regles d'association reposant sur ces trois mesures est propose et teste sur des donnees bancaires. Une comparaison avec les algorithmes apriori et ocd a mis en evidence l'interet de cet algorithme. Une etude particuliere a ete menee pour les variables ordinales afin de prendre en compte leur structure d'ordre. Une mesure statistique est proposee, l'intensite d'implication ordinale, qui evalue pour la regle xy si le nombre des individus possedant de fortes valeurs pour la variable x et de faibles valeurs pour la variable y est significativement faible comparativement a ce que l'on obtiendrait si par hypothese ces deux variables etaient independantes. Cette mesure a conduit a l'extraction d'un nouveau type de regles, les regles ordinales. Un algorithme d'extraction automatique de regles ordinales est propose et valide sur les memes donnees bancaires que pour le premier algorithme. Afin de valider nos resultats, une comparaison avec d'autres techniques a ete menee et a montre l'apport de ce nouveau type d'algorithme.