Una metodología para la detección del perfil de un autor

Resumen En este articulo se presenta una metodologia para la deteccion del perfil de un autor usando los siguientes dos elementos: genero y edad. Para esto se parte de un conjunto de dialogos, escritos en dos idiomas: ingles y espanol, proporcionado para la competencia Author Profiling dentro del foro de evaluacion “Uncovering Plagiarism, Authorship, and Social Software Misuse” (PAN2013). Se utiliza conteos de caracteristicas lexicas, semanticas y sintacticas para generar un sistema de clasificacion de dos fases, el cual clasifica primero el genero y posteriormente la edad. Los resultados obtenidos muestran que, con la cantidad de datos disponibles, es posible caracterizar tanto la edad como el genero de un autor con una exactitud mayor al 50%. Sin embargo, estos valores podrian mejorarse al tener una mayor evidencia de informacion en los datos de entrenamiento.