论文信息 - Sélection et transformation de variables pour la classification Multi-Label par une approche MDL

Sélection et transformation de variables pour la classification Multi-Label par une approche MDL

Résumé. La classification multi-label est une extension de la classification supervisée au cas de plusieurs labels. Elle a connu un regain d’intérêt récent dans la communauté du machine learning de par son utilité dans plusieurs domaines. Comme pour tout problème de machine learning, le besoin de prétraiter les données multi-label est apparu comme une nécessité afin d’améliorer les performances des classifieurs. Dans cet article, nous introduisons une nouvelle méthode permettant de prétraiter des variables descriptives par discrétisation ou groupement de valeur, dans le cas de plusieurs labels à prédire. Le choix du meilleur prétraitement est posé comme un problème de sélection de modèle, et est résolu au moyen d’une approche bayésienne. Une étude comparative est réalisée avec d’autres méthodes de l’état de l’art afin de positionner la nouvelle méthode et de montrer l’intérêt de la sélection de variables pour la classification.

Marc Boullé | Nicolas Voisine | Sènami C. Fréjus Ahomagnon

[1] Grigorios Tsoumakas,et al. MULAN: A Java Library for Multi-Label Learning , 2011, J. Mach. Learn. Res..

[2] Zhi-Hua Zhou,et al. ML-KNN: A lazy learning approach to multi-label learning , 2007, Pattern Recognit..

[3] J. Rissanen. A UNIVERSAL PRIOR FOR INTEGERS AND ESTIMATION BY MINIMUM DESCRIPTION LENGTH , 1983 .

[4] Marc Boullé,et al. MODL: A Bayes optimal discretization method for continuous attributes , 2006, Machine Learning.

[5] Saso Dzeroski,et al. An extensive experimental comparison of methods for multi-label learning , 2012, Pattern Recognit..

[6] M. C. Monard,et al. A systematic review to identify feature selection publications in multi-labeled data , 2012 .

[7] Peerapon Vateekul,et al. Irrelevant attributes and imbalanced classes in multi-label text-categorization domains , 2011, Intell. Data Anal..

[8] Grigorios Tsoumakas,et al. Multi-Label Classification of Music into Emotions , 2008, ISMIR.

[9] Newton Spolaôr,et al. A Comparison of Multi-label Feature Selection Methods using the Problem Transformation Approach , 2013, CLEI Selected Papers.