Exploração de Grafos RDF com Distribuição Controlada

The communication costs involved in retrieving distributed data in SPARQL queries have a big impact on the system performance. In this paper, we define a parallel graph processing model that explores the existence of allocation patterns, which consist of information on how data has been distributed among servers. Based on this model, we define two types of communication schedules: get-frag and send-result. These strategies are of great interest to query optimizers for efficient query processing on distributed RDF stores. Resumo. Grande parte do custo envolvido no processamento distribuı́do de consultas SPARQL resulta do custo de comunicação para a obtenção dos dados envolvidos na consulta. Neste trabalho é definido um modelo de exploração de grafos paralelo para consultas SPARQL que considera a existência de padrões de distribuição de dados. A partir deste modelo, são definidos dois modelos de escalonamento de comunicação entre servidores: get-frag e send-result. Estes modelos poderão ser explorados futuramente por um otimizador para a execução eficiente de consultas sobre bases RDF distribuı́das.