Uma Abordagem para Caracterização de documentos RDF através de Esquemas Conceituais

A suitable storage model for RDF depends on a set of data characteristics and the knowledgment of its schema. This paper aims to contribute in this context on providing a method to extract conceptual schemas from RDF documents. The goal is to characterize an RDF data structure through an entityrelationship schema and its constructors. The proposed method is evaluated by a case study which demonstrates that the conceptual schemas generated are valid according to the model proposed by a benchmark for RDF. Resumo. Dentre as possibilidades de bancos de dados para o armazenamento de dados RDF, a escolha de um modelo adequado depende de um conjunto de caracterı́sticas dos dados e a compreensão de seu esquema. Este trabalho visa contribuir para este contexto através de um método de extração de esquemas conceituais a partir de documentos RDF. O objetivo deste método é caracterizar a estrutura de dados RDF através da produção de um esquema entidaderelacionamento e seus construtores. O método proposto foi avaliado por um estudo de caso que demonstrou que os esquemas conceituais gerados são válidos de acordo com o modelo proposto por um benchmark para RDF.

[1]  Haixun Wang,et al.  A Distributed Graph Engine for Web Scale RDF Data , 2013, Proc. VLDB Endow..

[2]  Bhavani M. Thuraisingham,et al.  R2D: Extracting Relational Structure from RDF Stores , 2009, 2009 IEEE/WIC/ACM International Joint Conference on Web Intelligence and Intelligent Agent Technology.

[3]  Peter A. Boncz,et al.  Deriving an Emergent Relational Schema from RDF Data , 2015, WWW.

[4]  Agma J. M. Traina,et al.  Relational graph data management on the edge: Grouping vertices' neighborhood with Edge-k , 2017, SBBD.

[5]  Gerhard Weikum,et al.  The RDF-3X engine for scalable management of RDF data , 2010, The VLDB Journal.

[6]  Christian Bizer,et al.  The Berlin SPARQL Benchmark , 2009, Int. J. Semantic Web Inf. Syst..

[7]  Octavian Udrea,et al.  Apples and oranges: a comparison of RDF benchmarks and real RDF datasets , 2011, SIGMOD '11.