Une classification expérimentale multi-critère des évaluateurs SPARQL répartis

sparql est le langage standard pour interroger des donnees au format rdf. Il exite une grande variete d'evaluateurs sparql mettant en place differentes architectures tant pour la repartition des donnees que pour le deroulement des calculs. Ces differences coupleescouplees`coupleesa des optimisations specifiques pour chaque evaluateur rendent la comparaison entre ces systemes impossible d'un point de vue theorique. Nous proposons un nouvel angle de comparaison des evaluateurs sparql repartis base sur un classement multi-critere. Nous suggerons d'utiliser un ensemble de cinq fonctionnalites afin d'obtenir une description plus fine des comportements des evaluateurs repartis plutot que de considerer l'analyse plus traditionnelle des performances temporelles. Afin d'illustrer cette methode, nous avons mene des experimentations mettant en competition dix systemes existants que nous avons ensuite classes en utilisant une grille de lecture aidantaaidant`aidanta la visualisation des avantages et des limitations des techniques dans le domaine de l'evaluation repartie de requetes sparql.

[1]  N. Shadbolt,et al.  4store: The Design and Implementation of a Clustered RDF Store , 2009 .

[2]  Georg Lausen,et al.  S2RDF: RDF Querying with SPARQL on Spark , 2015, Proc. VLDB Endow..

[3]  Georg Lausen,et al.  SP2Bench: A SPARQL Performance Benchmark , 2008, Semantic Web Information Management.

[4]  François Goasdoué,et al.  CliqueSquare: Flat plans for massively parallel RDF queries , 2015, 2015 IEEE 31st International Conference on Data Engineering.

[5]  Z. Meral Özsoyoglu,et al.  RBench: Application-Specific RDF Benchmarking , 2015, SIGMOD Conference.

[6]  Andreas Harth,et al.  CumulusRDF: Linked Data Management on Nested Key-Value Stores , 2011 .

[7]  Guillaume Blin,et al.  A survey of RDF storage approaches , 2012, ARIMA J..

[8]  Georg Lausen,et al.  PigSPARQL: mapping SPARQL to Pig Latin , 2011, SWIM '11.

[9]  M. Tamer Özsu,et al.  Diversified Stress Testing of RDF Data Management Systems , 2014, SEMWEB.

[10]  Ioana Manolescu,et al.  RDF in the clouds: a survey , 2014, The VLDB Journal.

[11]  Jeff Heflin,et al.  LUBM: A benchmark for OWL knowledge base systems , 2005, J. Web Semant..

[12]  Christian Bizer,et al.  The Berlin SPARQL Benchmark , 2009, Int. J. Semantic Web Inf. Syst..

[13]  Pierre Genevès,et al.  SPARQLGX: Efficient Distributed Evaluation of SPARQL with Apache Spark , 2016, International Semantic Web Conference.

[14]  Gianluca Demartini,et al.  BowlognaBench - Benchmarking RDF Analytics , 2011, SIMPDA.

[15]  Paul T. Groth,et al.  NoSQL Databases for RDF: An Empirical Evaluation , 2013, International Semantic Web Conference.

[16]  Jens Lehmann,et al.  DBpedia SPARQL Benchmark - Performance Assessment with Real Queries on Real Data , 2011, SEMWEB.

[17]  Adina Crainiceanu,et al.  Rya: a scalable RDF triple store for the clouds , 2012, Cloud-I '12.