Registro de Procedência de Ligações RDF em Dados Ligados

As many tools have been created to support linked data consumption and publishing, there is a demand for quality assessment and to verify these data. To make this possible, data about this consumption should be recorded. This paper presents an extension to a framework with the goal to support the recording and publishing of the information about the creation and consumption of linked data, in order to provide input for later quality assessment. Resumo. Com a criacao de ferramentas para consumir, relacionar e publicar dados ligados, surge a demanda para avaliar e comprovar a qualidade destes dados. Para tal, e necessario que informacoes sobre este consumo sejam registradas. Este trabalho propoe a extensao de uma arquitetura a fim de suportar o registro e publicacao de informacoes sobre a criacao destes dados, a fim de prover insumos para posterior avaliacao. 1. Introducao Com o desenvolvimento e adocao da web semântica, vieram padroes e formatos para integrar dados e informacoes oriundos de diferentes fontes. Ha iniciativas para disponibilizar dados em formatos padronizados, para que estes possam ser consumidos (e relacionados) com dados de diferentes fontes. Uma destas iniciativas e o Linked Data (dados ligados) 1, que consiste em interligar dados de diversas fontes segundo alguns principios. Estes principios sao: disponibilizar os dados em um formato padronizado – no caso o RDF (Resource Description Framework) 2 – e fornecer meios para acessar e identificar os dados disponibilizados. E possivel criar aplicacoes mais ricas em informacao atraves do consumo dos dados e seus relacionamentos de diversas fontes. Para tal, e necessario considerar problemas como a obtencao do dado, mapeamento de esquemas e vocabularios, e analise de qualidade do dado. Diante destes problemas, diversas ferramentas foram criadas para facilitar a integracao e consumo dos dados ligados, algumas listadas em [Bizer et al. 2009]. Nao ha a preocupacao em registrar informacoes de como estas novas relacoes foram geradas, criando um problema para provar a confiabilidade e corretude do processo empregado. Este trabalho propoe uma arquitetura a fim de suportar o registro de informacoes sobre a criacao das interligacoes de recursos RDF, ou seja, registrar as informacoes de quais processos foram utilizados para criacao, quais parâmetros configuraram estes processos, quais os resultados destes processos. Acredita-se que tais informacoes podem ajudar em futura analise de qualidade dos dados, tornando-se um ativo tanto para quem con1http://www.w3.org/DesignIssues/LinkedData.html 2http://www.w3.org/TR/REC-rdf-syntax/