Knowledge extraction and representation learning for music recommendation and classification

La creacion, publicacion y diseminacion de contenido musical ha cambiado radicalmente en las ultimas decadas. Por un lado, grandes cantidades de informacion son publicadas diariamente en paginas web, forums, wikis y redes sociales. Sin embargo, la mayor parte de estos contenidos son aun incomprensibles computacionalmente, ya que son creados por y para humanos. Por otro lado, los servicios de musica online ofrecen inagotables catalogos con millones de canciones. Esta disponibilidad presenta dos desafios. Primero, ?como clasificar adecuadamente un item musical en una gran coleccion? Segundo, ?como puede un usuario explorar o descubrir musica de su agrado entre todo el contenido disponible? En esta tesis, abordamos estas cuestiones centrandonos en el enriquecimiento semantico de descripciones de items musicales (biografias de artistas, resenas musicales, metadatos, etc.), y en el aprovechamiento de datos heterogeneos presentes en grandes colecciones de musica (textos, audios e imagenes). Para ello, primero nos centramos en el problema de enlazar textos musicales con bases de conocimiento online y en la construccion automatizada de bases de conocimiento musical. Luego investigamos como el conocimiento extraido puede impactar en sistemas de recomendacion y clasificacion, ademas de en estudios musicologicos. Mostramos como el modelado de informacion semantica contribuye a mejorar los resultados con respecto a metodos basados solo en texto, tanto en similitud de artistas como en clasificacion de generos musicales, y a conseguir mejoras significativas en recomendacion de musica con respecto a algoritmos de referencia, mientras a su vez se promueven recomendaciones de items menos populares. A continuacion, investigamos el aprendizaje de nuevas representaciones de datos a partir de contenidos multimodales utilizando redes neuronales, y lo aplicamos a los problemas de recomendar musica nueva y clasificar generos musicales con multiples etiquetas, mostrando que el enriquecimiento semantico y la combinacion de representaciones aprendidas produce mejores resultados. Uno de los frutos de esta tesis es la publicacion de seis datasets y dos bases de conocimiento. Ademas, nuestros descubrimientos pueden ser directamente aplicados al diseno de nuevos algoritmos de recomendacion de musica, y mas concretamente, de artistas nuevos y desconocidos, lo cual tiene potencial impacto en la industria musical. Aunque nuestra investigacion esta motivada por las particularidades del dominio de la musica, creemos que las metodologias propuestas pueden ser facilmente generalizables a otros dominios.