Génération de RDF à partir de sources de données aux formats hétérogènes

Contrairement a ce que promeut le Web des donnees, les donnees exposees par la plupart des organisations sont dans des formats non-RDF tels que CSV, JSON, ou XML. De plus sur le Web des objets, les objets contraints prefereront des formats binaires tels que EXI ou CBOR aux formats RDF textuels. Dans ce contexte, RDF peut toutefois servir de lingua franca pour l'interoperabilite semantique, l'integration de donnees aux formats heterogenes, le raisonnement, et le requetage. Dans ce but, plusieurs outils et formalismes permettent de transformer des documents non-RDF vers RDF, les plus flexibles etant bases sur des langages de transformation ou de correspondance (GRDDL, XSPARQL, R2RML, RML, CSVW, etc.). Cet article definit un nouveau langage, SPARQLGenerate, qui permet de generer du RDF a partir: (i) d'une base de donnees RDF, et (ii) d'un nombre quelconque de documents aux formats arbitraires. L'originalite de SPARQL-Generate est qu'il etend SPARQL 1.1, et peut donc (i) etre appris facilement par les ingenieurs de la connaissance familiers de SPARQL, (ii) etre implemente au dessus de n'importe quel moteur SPARQL existant, (iii) tirer parti des mecanismes d'extension de SPARQL pour prendre en compte de futurs formats.