Clasificación de documentos basada en la opinión: experimentos con un corpus de críticas de cine en español

En los ultimos anos se ha producido un creciente interes por el procesamiento automatico de las opiniones contenidas en documentos de texto, en parte como consecuencia del aumento exponencial de contenidos generados por usuarios en la Web 2.0, y por el interes entre otros de empresas y gobiernos en analizar, filtrar o detectar automaticamente las opiniones vertidas por sus clientes o ciudadanos. Tomando como punto de partida trabajos de otros autores para el ingles, en el presente articulo exponemos los resultados obtenidos en la experimentacion con un clasificador no supervisado de documentos basado en la opinion para el espanol. Proponemos tambien una version supervisada del clasificador que obtiene un resultado sensiblemente mejor. Como paso previo a la experimentacion, y ante la ausencia de recursos en espanol para desarrollar nuestro trabajo, presentamos un corpus de criticas de cine en espanol, que ha sido puesto a disposicion de la comunidad cientifica.