English Abstract: Musicological knowledge is spread between the lines of thousands of texts stored in hundreds of music libraries. Technology, and more recently semantic technologies, may play a key role in the way information is retrieved. In this article, an analysis of the evolution of music digital libraries from a technological perspective is presented. Then, a methodology to exploit implicit knowledge present in collections of text documents is proposed. The described methodology is applied over a set of 16,707 artist biographies gathered from Grove Music Online. A knowledge graph is then created after applying a process of information extraction. Several insights are extracted from the data to illustrate the possibilities of the proposed methodology for musicologists. Finally, an extension of the methodology is proposed to combine different data sources, and illustrated with the creation of a flamenco music knowledge base. French Abstract: Les connaissances musicologiques sont étalées entre les lignes de milliers de textes qui sont conservés dans des centaines de bibliothèques. La technologie, et plus récemment les technologies sémantiques, pourraient jouer un rôle clé dans la manière dont les informations sont recherchées. Cet article présente une analyse de l’évolution des bibliothèques musicales numériques d’un point de vue technologique, et propose une méthodologie qui vise à exploiter les connaissances présentes dans les collections de documents textuels. La méthodologie décrite s’applique à plus de 16 707 biographies d’artistes rassemblées à partir du Grove Music Online. Un graphique représentant les différents détails, d’après les requêtes, est ensuite établi par voie d’extraction d’information. Plusieurs aperçus sont extraits des données afin d’illustrer les différentes possibilités proposées par la méthodologie, à destination des musicologues. Enfin, une extension de la méthodologie est proposée pour pouvoir combiner diverses sources de données, illustrée par la création d’une base de connaissance de flamenco. German Abstract: Musikwissenschafliches Wissen ist auf tausende von Texten verteilt, die in hunderten von Musik-bibliotheken vorgehalten werden. Technologie und in jüngerer Zeit auch semantische Techniken spielen für die Auswertung dieser Informationen eine große Rolle. Dieser Beitrag präsentiert zunächst eine Analyse der Entwicklung von digitalen Musikbibliotheken aus einem technischen Blickwinkel und schlägt daran anschließend eine Methodik vor, wie in Sammlungen von Text-dokumenten verborgenes Wissen ausgewertet werden kann. Die beschriebene Methode wird auf 16.707 Künstlerbiografien aus Grove Music Online angewendet. Auf die Informationsauswertung aufbauend kreieren die Autoren eine grafische Darstellung des Wissens und ziehen unterschiedliche Erkenntnisse aus den Daten, um die vielfachen Möglichkeiten der vorgeschlagenen Methodik für Musikwissenschaftler zu illustrieren. Abschließend schlagen sie eine Ausweitung der Methodik mittels der Kombination verschiedener Datenquellen vor und konkretisieren diesen Vorschlag mit dem Aufbau einer Datenbank zur Flamenco-Musik.
Fabien Gouyon,et al.
Proceedings of the 13th International Society for Music Information Retrieval Conference, ISMIR 2012
Kamran Sedig,et al.
Interaction and the epistemic potential of digital libraries
International Journal on Digital Libraries.
Djoerd Hiemstra,et al.
Exploiting user disagreement for web search evaluation: an experimental approach
Xavier Serra,et al.
A Semantic-Based Approach for Artist Similarity
Hector Garcia-Molina,et al.
Evaluating entity resolution results
Proc. VLDB Endow..
柴田 南雄,et al.
ニューグローヴ世界音楽大事典 = The new Grove dictionary of music and musicians
G. Grove,et al.
Dictionary of Music and Musicians
Sergey Brin,et al.
The Anatomy of a Large-Scale Hypertextual Web Search Engine
Comput. Networks.
Oscar Corcho,et al.
The Semantic Web: Semantics and Big Data
Lecture Notes in Computer Science.