PGP-mc : extraction parallèle efficace de motifs graduels

Initialement utilises pour les systemes de commande, les regles et motifs graduels (de la forme "plus une personne est âgee, plus son salaire est ele-ve") trouvent de tres nombreuses applications, par exemple dans les domaines de la biologie, des donnees en flots (e.g. issues de reseaux de capteurs), etc. Tres recemment, des algorithmes ont ete proposes pour extraire automatiquement de tels motifs. Cependant, meme si certains d'entre eux ont permis des gains de performance importants, les algorithmes restent couteux et ne permettent pas de traiter efficacement les bases de donnees reelles souvent tres volumi-neuses (en nombre de lignes et/ou nombre d'attributs). Nous proposons donc dans cet article une methode originale de recherche de ces motifs utilisant le multi-threading pour exploiter au mieux les multiples coeurs presents dans la plupart des ordinateurs et serveurs actuels. L'efficacite de cette approche est va-lidee par une etude experimentale.

[1]  Srinivasan Parthasarathy,et al.  Adaptive Parallel Graph Mining for CMP Architectures , 2006, Sixth International Conference on Data Mining (ICDM'06).

[2]  Rakesh Agarwal,et al.  Fast Algorithms for Mining Association Rules , 1994, VLDB 1994.

[3]  Srinivasan Parthasarathy,et al.  Parallel Algorithms for Discovery of Association Rules , 1997, Data Mining and Knowledge Discovery.

[4]  Eyke Hüllermeier,et al.  Association Rules for Expressing Gradual Dependencies , 2002, PKDD.

[5]  Michael Stonebraker,et al.  The Morgan Kaufmann Series in Data Management Systems , 1999 .

[6]  Shirish Tatikonda,et al.  Mining Tree-Structured Data on Multicore Systems , 2009, Proc. VLDB Endow..

[7]  Mohammed J. Zaki Parallel Sequence Mining on Shared-Memory Machines , 1999, J. Parallel Distributed Comput..

[8]  Hiroki Arimura,et al.  LCM ver.3: collaboration of array, bitmap and prefix tree for frequent itemset mining , 2005 .

[9]  Céline Fiot,et al.  Gradual Trends in Fuzzy Sequential Patterns , 2008, IPMU 2008.

[10]  Daniel Sánchez,et al.  An Alternative Approach to Discover Gradual Dependencies , 2007, Int. J. Uncertain. Fuzziness Knowl. Based Syst..

[11]  Salvatore Orlando,et al.  Parallel Mining of Frequent Closed Patterns: Harnessing Modern Computer Architectures , 2007, Seventh IEEE International Conference on Data Mining (ICDM 2007).

[12]  Maguelonne Teisseire,et al.  Mining Frequent Gradual Itemsets from Large Databases , 2009, IDA.

[13]  Nicolas Pasquier,et al.  Efficient Mining of Association Rules Using Closed Itemset Lattices , 1999, Inf. Syst..

[14]  Eric Li,et al.  Optimization of Frequent Itemset Mining on Multiple-Core Processor , 2007, VLDB.

[15]  Rakesh Agrawal,et al.  Parallel Mining of Association Rules , 1996, IEEE Trans. Knowl. Data Eng..

[16]  Maguelonne Teisseire,et al.  Fast extraction of gradual association rules: a heuristic based method , 2008, CSTST.

[17]  Jian Pei,et al.  Mining frequent patterns without candidate generation , 2000, SIGMOD '00.

[18]  Jiawei Han,et al.  gSpan: graph-based substructure pattern mining , 2002, 2002 IEEE International Conference on Data Mining, 2002. Proceedings..