Métriques structurelles pour l'analyse de bases orientées documents

La flexibilite dans la structuration des donnees dans les bases orientees documents est appreciee pour permettre un developpement initial rapide. Cependant, les possibilites de structuration des donnees sont nombreuses et le choix de structuration adopte reste assez crucial par son impact potentiel sur plusieurs aspects de la qualite des applications. En effet, chaque structuration peut presenter des avantages et des inconvenients notamment en matiere d'em-preinte memoire, redondance de donnees engendree, cout de navigation dans les structures et acces a certaines donnees, lisibilite des programmes. Dans cet article nous proposons un ensemble de metriques structurelles pour des "schemas" de documents JSON. Ces metriques permettent de refleter la complexite des schemas et des criteres de qualite tels que leur lisibilite et maintenabilite. La definition de ces metriques s'appuie, entre autres, sur des experimentations avec MongoDB, des travaux lies a XML et les metriques utilisees en Genie logiciel pour la qualite du code. La definition des metriques est completee par un scenario de validation.

[1]  Serge Abiteboul,et al.  Querying Semi-Structured Data , 1997, Encyclopedia of Database Systems.

[2]  Martin Fowler,et al.  NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence , 2012 .

[3]  Andreas Heuer,et al.  Metrics for XML Document Collections , 2002, EDBT Workshops.

[4]  Rubby Casallas,et al.  Data schema does matter, even in NoSQL systems! , 2016, 2016 IEEE Tenth International Conference on Research Challenges in Information Science (RCIS).

[5]  Rui Liu,et al.  NoSE: Schema Design for NoSQL Applications , 2017, IEEE Trans. Knowl. Data Eng..

[6]  Zoran Budimac,et al.  XML schema metrics for quality evaluation , 2014, Comput. Sci. Inf. Syst..

[7]  Zijing Li,et al.  Schema Conversion Model of SQL Database to NoSQL , 2014, 2014 Ninth International Conference on P2P, Parallel, Grid, Cloud and Internet Computing.

[8]  Rick. Copeland MongoDB Applied Design Patterns , 2013 .

[9]  Sallie M. Henry,et al.  Object-oriented metrics that predict maintainability , 1993, J. Syst. Softw..

[10]  Chris F. Kemerer,et al.  Towards a metrics suite for object oriented design , 2017, OOPSLA '91.

[11]  Matteo Golfarelli,et al.  Schema profiling of document-oriented databases , 2018, Inf. Syst..

[12]  Anas N. Al-Rabadi,et al.  A comparison of modified reconstructability analysis and Ashenhurst‐Curtis decomposition of Boolean functions , 2004 .

[13]  Danilo Ardagna,et al.  Issues in Handling Complex Data Structures with NoSQL Databases , 2012, 2012 14th International Symposium on Symbolic and Numeric Algorithms for Scientific Computing.