Semantic annotation of music collections: A computational approach

El consumo de la musica ha cambiado drasticamente en los ultimos anos. Con la llegada de la musica digital, el coste de produccion se ha reducido considerablemente. La expansion de la Web ha ayudado a promover la exploracion de mucho mas contenido musical. Algunas tiendas musicales on-line, como iTunes o Amazon, poseen millones de canciones en sus colecciones. Sin embargo, acceder a estas colecciones de una manera eficiente es todavia un gran reto. En esta tesis nos centramos en el problema de anotar colecciones musicales con palabras semanticas, tambien conocidas como tags. Los metodos utilizados en esta tesis estan cimentados sobre los campos de recuperacion de la informacion, la inteligencia artifical, y el procesado del senal. Proponemos un algoritmo para anotar musica automaticamente, usando similitud de audio a nivel de contenido para propagar tags entre canciones. El algoritmo se evalua extensamente usando multiples colecciones musicales de distinto tamano y calidad de los datos, incluyendo una coleccion de mas de medio millon de canciones, anotadas con tags sociales derivados de una comunidad musical. Evaluamos la calidad de nuestro algoritmo mediante una comparacion con algoritmos del estado del arte. Adicionalmente, discutimos la importancia de usar medidas de evaluacion que cubren diferentes dimensiones; es decir, evaluaciones a nivel de cancion y a nivel de tag. Nuestro algoritmo ha sido evaluado y se ha clasificado en altas posiciones en el concurso de evaluacion internacional MIREX 2011. Los resultados obtenidos tambien demuestran algunas limitaciones de la anotacion automatica, relacionadas con las inconsistencias en los datos, la correlacion de conceptos y la dificultad de capturar algunos tags personales con informacion del contenido. Esto es mas evidente en las comunidades musicales, donde los usuarios pueden anotar canciones con cualquier palabra, sea esta contextual o no. Con el fin de abordar estas limitaciones, presentamos un amplio estudio sobre la naturaleza de las folksonomias musicales. Concretamente, estudiamos si las anotaciones hechas por una gran comunidad de usuarios concuerdan con un vocabulario mas controlado y estructurado por parte de expertos en el campo. Los resultados revelan que algunos tags estan claramente definidos y comprendidos tanto desde el punto de vista de los expertos como el de la sabiduria popular, mientras que hay otros tags sobre los cuales es dificil encontrar un consenso. Por ultimo, extendemos nuestro previo trabajo a un amplio abanico de conceptos semanticos. Presentamos un metodo novedoso para descubrir conceptos semanticos implicitos en los tags sociales, y clasificar dichos tags con respecto a los conceptos semanticos. Los ultimos hallazgos pueden ayudar a entender la naturaleza de los tags sociales, y por consiguiente ser beneficiales para una adicional mejora para la anotacion automatica de la musica.