Prototype Selection Methods

En reconocimiento de patrones, los clasificadores supervisados asignan una clase a nuevos objetos o prototipos. Para clasificar prototipos se usa un conjunto de entrenamiento el cual proporciona informacion a los clasificadores durante la etapa de entrenamiento. En la practica, no toda la informacion en los conjuntos de entrenamiento es util, por lo que se pueden descartar prototipos irrelevantes. A este proceso se le denomina seleccion de prototipos, el cual es el tema central de esta tesis. Mediante la seleccion de prototipos se reduce el tamano de los conjuntos de entrenamiento, lo cual permite una reduccion en los tiempos de ejecucion en las fases de clasificacion o entrenamiento de los clasificadores. Se han propuesto diversos metodos para la seleccion de prototipos cuyo desempeno depende del uso de un clasificador particular, por otra parte, la mayoria de los metodos para la seleccion de prototipos son costosos, principalmente cuando se procesan grandes conjuntos de datos. En esta tesis se presentan cuatro metodos para la seleccion de prototipos; dos de ellos se basan en la busqueda secuencial flotante y los dos restantes en agrupamientos y relevancia de prototipos respectivamente

[1]  José Francisco Martínez Trinidad,et al.  Sequential Search for Decremental Edition , 2005, IDEAL.

[2]  Tony R. Martinez,et al.  Reduction Techniques for Instance-Based Learning Algorithms , 2000, Machine Learning.

[3]  Fabrizio Angiulli Condensed Nearest Neighbor Data Domain Description , 2007, IEEE Trans. Pattern Anal. Mach. Intell..

[4]  Hongbin Zhang,et al.  Optimal reference subset selection for nearest neighbor classification by tabu search , 2002, Pattern Recognit..

[5]  James C. Bezdek,et al.  Nearest prototype classification: clustering, genetic algorithms, or random search? , 1998, IEEE Trans. Syst. Man Cybern. Part C.

[6]  Dennis L. Wilson,et al.  Asymptotic Properties of Nearest Neighbor Rules Using Edited Data , 1972, IEEE Trans. Syst. Man Cybern..

[7]  Chidchanok Lursinsap,et al.  A divide-and-conquer approach to the pairwise opposite class-nearest neighbor (POC-NN) algorithm , 2005, Pattern Recognit. Lett..

[8]  Christoph F. Eick,et al.  Using representative-based clustering for nearest neighbor dataset editing , 2004, Fourth IEEE International Conference on Data Mining (ICDM'04).

[9]  James C. Bezdek,et al.  Nearest prototype classifier designs: An experimental study , 2001, Int. J. Intell. Syst..

[10]  Hugh B. Woodruff,et al.  An algorithm for a selective nearest neighbor decision rule (Corresp.) , 1975, IEEE Trans. Inf. Theory.

[11]  Josef Kittler,et al.  Floating search methods for feature selection with nonmonotonic criterion functions , 1994, Proceedings of the 12th IAPR International Conference on Pattern Recognition, Vol. 3 - Conference C: Signal Processing (Cat. No.94CH3440-5).

[12]  David W. Aha,et al.  Instance-Based Learning Algorithms , 1991, Machine Learning.

[13]  Loris Nanni,et al.  A clustering method for automatic biometric template selection , 2006, Pattern Recognit..

[14]  Huan Liu,et al.  On Issues of Instance Selection , 2002, Data Mining and Knowledge Discovery.

[15]  C. A. Murthy,et al.  Maxdiff kd-trees for data condensation , 2006, Pattern Recognit. Lett..

[16]  D. Randall Wilson,et al.  Advances in instance-based learning algorithms , 1997 .