Segmentacide los Contribuyentes que Declaran IVA Aplicando Herramientas de Clustering

En este trabajo se llevo a cabo una caracterizacion de contribuyentes que declaran IVA a traves de la aplicacion de algoritmos de clustering, con el fin de aportar nueva informacion de apoyo a la labor fiscalizadora del SII. La segmentacion se realizo a partir de la informacion tributaria consignada por los contribuyentes, en sus declaraciones de IVA (Formulario F29) y en su Inicio de Actividades. En primer lugar, aplicando un proceso de limpieza y reduccion de los datos, se confecciono un vector de caracteŕisticas compuesto por la informacion del formulario F29, del documento de Inicio de Actividades, tales como el conjunto de Actividades Economicas (actecos) y la comuna. Sobre este vector de caracteŕisticas, se aplicaron los algoritmos de clustering Self Organizing Feature Map (SOFM) y K-means. Comparando los resultados de distintas aplicaciones de estos dos metodos, se obtuvo el vector de caracteŕisticas final y la segmentacion de los contribuyentes. En ambos casos, SOFM y K-means, los resultados de la segmentacion son comparables, lo cual valida el modelo de comportamiento del contribuyente desarrollado. A partir de la segmentacion propuesta, el organismo fiscalizador mejora su labor, haciendo mas certero el proceso de validacion de la informacion que declara el contribuyente.