Clustering multi-vues : une approche centralisée
暂无分享,去创建一个
Nous abordons dans ce papier le probleme de la classification non-supervisee multi-vues, i.e. ou les donnees peuvent etre decrites par plusieurs ensembles de variables ou par plusieurs matrices de proximites. De nombreux domaines d'applications sont concernes, tels la Recherche d'Information, la Biologie, la Chimie et le Marketing. L'objet de cet axe de recherche est de proposer un cadre theorique et methodologique permettant la decouverte d'une classification realisant un consensus entre les organisations emanant de toutes les vues. Il convient alors de combiner les informations de chacune des vues par l'intermediaire d'un processus de fusion consistant a identifier l'accord entre les vues et a reduire le conflit. Plusieurs strategies de fusion peuvent etre appliquees, en amont, en aval, ou pendant le processus de classification. Nous presentons les differentes solutions de fusion envisageables suivant differents contextes applicatifs, puis nous nous focalisons sur des techniques dites centralisees. Nous proposons une approche de classification non supervisee floue qui generalise differentes solutions de fusion et nous presentons une extension a noyaux de cette approche, permettant le traitement de donnees heterogenes. Nous montrons l'apport theorique et experimental de cette approche sur des jeux de donnees benchmarks synthetiques et reels.