Vers une classification non supervisée adaptée pour obtenir des arbres de décision simplifiés

Résumé. L’induction d’arbre de décision est une technique puissante et populaire pour extraire de la connaissance. Néanmoins, les arbres de décision obtenus depuis des données issues du monde réel peuvent être très complexes et donc difficiles à exploiter. Dans ce cadre, cet article présente une solution originale pour adapter le résultat d’une classification non supervisée quelconque afin d’obtenir des arbres de décision simplifiés pour chaque cluster.

[1]  Jianhong Wu,et al.  Data clustering - theory, algorithms, and applications , 2007 .

[2]  Benoît Otjacques,et al.  Using Clustering to Improve Decision Trees Visualization , 2013, 2013 17th International Conference on Information Visualisation.

[3]  Thomas Tamisier,et al.  User-Driven Data Preprocessing for Decision Support , 2013, CDVE.

[4]  David W. Aha,et al.  Simplifying decision trees: A survey , 1997, The Knowledge Engineering Review.

[5]  Sreerama K. Murthy,et al.  Automatic Construction of Decision Trees from Data: A Multi-Disciplinary Survey , 1998, Data Mining and Knowledge Discovery.

[6]  Ian H. Witten,et al.  The WEKA data mining software: an update , 2009, SKDD.

[7]  J. Ross Quinlan,et al.  Induction of Decision Trees , 1986, Machine Learning.