Une approche ensembliste inspirée du boosting en classification non supervisée

Résumé. En classification supervisée, de nombreuses méthodes ensem blist s peuvent combiner plusieurs hypothèses de base afin de créer u ne règle de décision finale plus performante. Ainsi, il a été montré que des méthodes comme le baggingou leboostingpouvaient se révéler intéressantes, tant dans la phase d’apprentissage qu’en généralisation. Dès lors, il est ten tant de vouloir s’inspirer des grands principes d’une méthode comme le boostingen classification non supervisée. Or, il convient préalablement de se confron te aux difficultés connues de la thématique des ensembles de regroupeurs (corr espondance des classes, agrégation des résultats, qualité) puis d’introd ui e l’idée duboosting dans un processus itératif. Cet article propose une méthode ensembliste inspirée du boosting, qui, à partir d’un partitionnement flou obtenu par les c-moy ennes floues (fuzzy-c-means), va insister itérativement sur les e x mples difficiles pour former une partition dure finale plus pertinente.

[1]  James C. Bezdek,et al.  Pattern Recognition with Fuzzy Objective Function Algorithms , 1981, Advanced Applications in Pattern Recognition.

[2]  Yoav Freund,et al.  A decision-theoretic generalization of on-line learning and an application to boosting , 1995, EuroCOLT.

[3]  Edwin Diday,et al.  Optimization in non-hierarchical clustering , 1974, Pattern Recognit..

[4]  Michalis Vazirgiannis,et al.  c ○ 2001 Kluwer Academic Publishers. Manufactured in The Netherlands. On Clustering Validation Techniques , 2022 .

[5]  J. MacQueen Some methods for classification and analysis of multivariate observations , 1967 .

[6]  Joydeep Ghosh,et al.  Cluster Ensembles --- A Knowledge Reuse Framework for Combining Multiple Partitions , 2002, J. Mach. Learn. Res..

[7]  Philippe Leray,et al.  Pertinence des mesures de confiance en classification , 2000 .

[8]  Leo Breiman,et al.  Bagging Predictors , 1996, Machine Learning.

[9]  Andreas Stafylopatis,et al.  A clustering method based on boosting , 2004, Pattern Recognit. Lett..

[10]  Patrice Bertrand,et al.  Loevinger's measures of rule quality for assessing cluster stability , 2006, Comput. Stat. Data Anal..

[11]  Kurt Hornik,et al.  Voting-Merging: An Ensemble Method for Clustering , 2001, ICANN.

[12]  Ana L. N. Fred,et al.  Finding Consistent Clusters in Data Partitions , 2001, Multiple Classifier Systems.

[13]  I. C. Lerman,et al.  Les bases de la classification automatique , 1971 .

[14]  F. Leisch Bagged Clustering , 1999 .