Recherche de séquences spatio-temporelles peu contredites dans des données hydrologiques

In this paper, we propose a knowledge discovery process for hydrologic data. We adopt a sequential pattern algorithm applied on data from stations located along several rivers. Data are pre-treated according to different spatial proximities and the analysis of the number of patterns obtained highlights the influence of such defined relations. We propose an objective measure of validation, called the measure of temporal contradictionless, to help the expert to discover usual information. With this work, we move towards a new way of spatial indicator discovery to help interpretation of ecological monitoring of watercourses and pressure data. / Dans cet article, nous presentons un projet de decouverte de connaissances dans des donnees hydrologiques. Pour cela, nous appliquons un algorithme d'extraction de motifs sequentiels sur les donnees relevees au niveau de stations reparties le long de plusieurs rivieres. Les donnees sont pre-traitees afin de considerer differentes proximites spatiales et l'analyse du nombre de motifs obtenus souligne l'influence des relations ainsi definies. Nous proposons et detaillons une mesure objective d'evaluation, appelee la mesure de moindre contradiction temporelle, afin d'aider l'expert dans la decouverte de nouveautes. Ces elements posent les premieres bases de travaux plus ambitieux permettant de proposer des indicateurs spatialises pour l'aide a l'interpretation des donnees de suivi ecologique des cours d'eau et des donnees de pression.

[1]  Jianyong Wang,et al.  Mining sequential patterns by pattern-growth: the PrefixSpan approach , 2004, IEEE Transactions on Knowledge and Data Engineering.

[2]  Osmar R. Zaïane,et al.  A study on interestingness measures for associative classifiers , 2010, SAC '10.

[3]  Philippe Lenca,et al.  A Study of the Robustness of Association Rules , 2007, DMIN.

[4]  Judy Kay,et al.  Clustering and Sequential Pattern Mining of Online Collaborative Learning Data , 2009, IEEE Transactions on Knowledge and Data Engineering.

[5]  Pascal Poncelet,et al.  Aide à la décision pour la maintenance ferroviaire préventive , 2010, EGC.

[6]  Nikos Mamoulis,et al.  Mining frequent spatio-temporal sequential patterns , 2005, Fifth IEEE International Conference on Data Mining (ICDM'05).

[7]  Dominique Gay,et al.  Vers une extraction et une visualisation des co-localisations adaptées aux experts , 2010, EGC.

[8]  Florent Masseglia,et al.  Mining sequential patterns from data streams: a centroid approach , 2006, Journal of Intelligent Information Systems.

[9]  Ramakrishnan Srikant,et al.  Mining sequential patterns , 1995, Proceedings of the Eleventh International Conference on Data Engineering.

[10]  Jian Pei,et al.  Mining Access Patterns Efficiently from Web Logs , 2000, PAKDD.

[11]  Jérôme Azé,et al.  A New Probabilistic Measure of Interestingness for Association Rules, Based on the Likelihood of the Link , 2007, Quality Measures in Data Mining.

[12]  Shashi Shekhar,et al.  Mixed-Drove Spatio-Temporal Co-occurrence Pattern Mining : A Summary of Results , 2006 .

[13]  Régis Gras,et al.  Élaboration et évaluation d'un indice d'implication pour des données binaires. I , 1981 .

[14]  P. Bolon,et al.  On mining pixel based evolution classes in satellite image time series , 2008 .

[15]  Jérôme Azé,et al.  Une nouvelle mesure de qualité pour l'extraction de pépites de connaissances , 2003, EGC.

[16]  Jaideep Srivastava,et al.  Selecting the right interestingness measure for association patterns , 2002, KDD.

[17]  Anne Laurent,et al.  S2MP: Similarity Measure for Sequential Patterns , 2008, AusDM.

[18]  Maguelonne Teisseire,et al.  Web usage mining: extracting unexpected periods from web logs , 2005, Data Mining and Knowledge Discovery.

[19]  Sylvie Guillaume,et al.  Comparaison entre deux indices pour l'évaluation probabiliste discriminante des règles d'association , 2011, EGC.

[20]  Jeffrey Xu Yu,et al.  Scalable sequential pattern mining for biological sequences , 2004, CIKM '04.

[21]  Howard J. Hamilton,et al.  Interestingness measures for data mining: A survey , 2006, CSUR.