Approche dirigée par les modèles pour l'implantation de bases de données massives sur des SGBD NoSQL. (MDA-based Approach for implementing Big Data on NoSQL systems)

La transformation digitale des entreprises et plus largement celle de la societe, entraine une evolution des bases de donnees (BD) relationnelles vers les BD massives. Dans les systemes informatiques decisionnels actuels, les decideurs doivent pouvoir constituer des bases de donnees, les reorganiser puis en extraire l’information pertinente pour la prise de decision. Ces systemes sont donc naturellement impactes par cette evolution ou les donnees sont generalement stockees sur des systemes NoSQL capables de gerer le volume, la variete et la velocite. Nos travaux s’inscrivent dans cette mutation ; ils concernent plus particulierement les mecanismes d’implantation d’une BD massive sur un SGBDNoSQL. Le point de depart du processus d’implantation est constitue d’un modele contenant la description conceptuelle des donnees et des contraintes d’integrite associees.Peu de travaux ont apporte des solutions automatiques completes portant a la fois sur les structures de donnees et les contraintes d’integrite. L’objectif de cette these est de proposer une demarche generale qui guide et facilite la tâche de transformation d’un modele conceptuel en un modele d’implantation NoSQL. Pour ceci, nous utilisons l’architecture MDA qui est une norme du consortium OMG pour le developpement dirige par les modeles.A partir d'un modele conceptuel exprime a l'aide du formalisme UML, notre demarche MDA applique deux processus unifies pour generer un modele d’implantation sur une plateforme NoSQL choisie par l’utilisateur : - Le processus de transformation d’un DCL, - Le processus de transformation des contraintes associees, Nos deux processus s’appuient sur :- Trois niveaux de modelisation : conceptuel, logique et physique, ou le modele logique correspond a une representation generique compatible avec les quatre types de SGBD NoSQL : colonnes, documents, graphes et cle-valeur, - Des metamodeles permettant de verifier la validite des modeles a chaque niveau, - Des normes de l’OMG pour formaliser l’entree du processus et l’ensemble des regles de transformation. Afin de verifier la faisabilite de notre solution, nous avons developpe un prototype compose de deux modules. Le premier applique un ensemble de regles de transformation sur un modele conceptuel et restitue un modele NoSQL associe a un ensemble de directives d’assistance. Le second module complete le premier en integrant les contraintes qui ne sont pas prises en compte dans le modele physique genere. Nous avons montre egalement la pertinence de nos propositions grâce a une evaluation realisee par des ingenieurs d’une societe specialisee dans le decisionnel.

[1]  Steve Ataky Tsham Mpinda,et al.  From Relational Database to Column-Oriented NoSQL Database: Migration Process , 2015 .

[2]  Fatma Abdelhédi,et al.  Big Data and Knowledge Management: How to Implement Conceptual Models in NoSQL Systems? , 2016, KMIS.

[3]  F. ABDELHEDI,et al.  Towards Automatic Generation of NoSQL Document-Oriented Models , 2018 .

[4]  Fatma Abdelhédi,et al.  L'implantation de sources de données dans un système NoSQL : formalisation des règles de passage conceptuel/logique , 2016, EDA.

[5]  Max Chevalier,et al.  Implementing Multidimensional Data Warehouses into NoSQL , 2015, ICEIS.

[6]  Kenneth Mark Anderson,et al.  MySQL to NoSQL: data modeling challenges in supporting scalability , 2012, SPLASH '12.

[7]  Chao Zhang,et al.  Transforming UML Class Diagram into Cassandra Data Model with Annotations , 2015, 2015 IEEE International Conference on Smart City/SocialCom/SustainCom (SmartCity).

[8]  Nadia Kabachi,et al.  Using the column oriented NoSQL model for implementing big data warehouses , 2015 .

[9]  Birger Andersson,et al.  Natural Language Processing and Information Systems , 2003, Lecture Notes in Computer Science.

[10]  Omar Boussaïd,et al.  Preparing complex data for warehousing , 2005, The 3rd ACS/IEEE International Conference onComputer Systems and Applications, 2005..

[11]  Rubby Casallas,et al.  Métriques structurelles pour l'analyse de bases orientées documents , 2018, INFORSID.

[12]  Frank Budinsky,et al.  Eclipse modeling framework : a developer's guide , 2004 .

[13]  Fatma Abdelhédi,et al.  Traduction Automatique de contraintes OCL dans une BD NoSQL , 2018, EDA.

[14]  Jordi Cabot,et al.  UMLtoGraphDB: Mapping Conceptual Schemas to Graph Databases , 2016, ER.

[15]  Yuri Demchenko,et al.  Architecture Framework and Components for the Big Data Ecosystem , 2013 .

[16]  Keke Gai,et al.  Intelligent cryptography approach for secure distributed big data storage in cloud computing , 2017, Inf. Sci..

[17]  Elder Cirilo,et al.  A Framework for Migrating Relational Datasets to NoSQL1 , 2015, ICCS.

[18]  Fatma Abdelhédi,et al.  Processus de transformation MDA d'un schéma conceptuel de données en un schéma logique NoSQL , 2016, INFORSID.

[19]  Ed Seidewitz,et al.  What Models Mean , 2003, IEEE Softw..

[20]  Fatma Abdelhédi,et al.  UMLtoNoSQL: Automatic Transformation of Conceptual Schema to NoSQL Databases , 2017, 2017 IEEE/ACS 14th International Conference on Computer Systems and Applications (AICCSA).

[21]  Alberto Abelló,et al.  NOSQL Design for Analytical Workloads: Variability Matters , 2016, ER.

[22]  Rakesh Kumar,et al.  Effective Way to Handling Big Data Problems using NoSQL Database (MongoDB) , 2015 .

[23]  Fatma Abdelhédi,et al.  MDA-Based Approach for NoSQL Databases Modelling , 2017, DaWaK.

[24]  Shalini Batra,et al.  MONGODB Versus SQL: A Case Study on Electricity Data , 2016 .

[25]  Omar Boussaïd,et al.  An Architecture Framework for Complex Data Warehouses , 2007, ICEIS.

[26]  Guan Le,et al.  Survey on NoSQL database , 2011, 2011 6th International Conference on Pervasive Computing and Applications.

[27]  Cristina Dutra de Aguiar Ciferri,et al.  Physical Data Warehouse Design on NoSQL Databases - OLAP Query Processing over HBase , 2016, ICEIS.

[28]  Ana Carolina Salgado,et al.  Conceptual Mappings to Convert Relational into NoSQL Databases , 2016, ICEIS.

[29]  Xavier Blanc MDA en action : Ingénierie logicielle guidée par les modèles , 2005 .

[30]  Yu-Lin Zheng,et al.  Automatic SQL-to-NoSQL schema transformation over the MySQL and HBase databases , 2015, 2015 IEEE International Conference on Consumer Electronics - Taiwan.

[31]  Alberto Abelló,et al.  Big Data Design , 2015, DOLAP.

[32]  Fadila Bentayeb,et al.  Approche de modélisation multidimensionnelle des données complexes : application aux données médicales, , 2009, EDA.

[33]  Guntis Arnicans,et al.  Migration of Relational Database to Document-Oriented Database: Structure Denormalization and Data Transformation , 2015, 2015 7th International Conference on Computational Intelligence, Communication Systems and Networks.

[34]  Annie I. Antón,et al.  Goal-based requirements analysis , 1996, Proceedings of the Second International Conference on Requirements Engineering.

[35]  Torben Bach Pedersen,et al.  Multidimensional data modeling for complex data , 1999, Proceedings 15th International Conference on Data Engineering (Cat. No.99CB36337).

[36]  Max Chevalier,et al.  Benchmark for OLAP on NoSQL technologies comparing NoSQL multidimensional data warehousing solutions , 2015, 2015 IEEE 9th International Conference on Research Challenges in Information Science (RCIS).

[37]  Fatma Abdelhédi,et al.  Formalizing the Mapping of UML Conceptual Schemas to Column-Oriented Databases , 2018, Int. J. Data Warehous. Min..

[38]  Jean Bézivin,et al.  Towards a precise definition of the OMG/MDA framework , 2001, Proceedings 16th Annual International Conference on Automated Software Engineering (ASE 2001).

[39]  Chao Zhang,et al.  Transforming UML class diagrams into HBase based on meta-model , 2014, 2014 International Conference on Information Science, Electronics and Electrical Engineering.

[40]  Daniel J. Abadi,et al.  Column-stores vs. row-stores: how different are they really? , 2008, SIGMOD Conference.

[41]  Chongxin Li,et al.  Transforming relational database into HBase: A case study , 2010, 2010 IEEE International Conference on Software Engineering and Service Sciences.

[42]  B. Combemale,et al.  Ingénierie Dirigée par les Modèles (IDM) -- État de l'art , 2008 .

[43]  Fatma Abdelhédi,et al.  Logical Unified Modeling for NoSQL Databases , 2017, ICEIS.

[44]  Fatma Abdelhédi,et al.  Modeling Framework for NoSQL Systems , 2017, CIbSE.

[45]  Mark Rouncefield,et al.  Model-driven engineering practices in industry , 2011, 2011 33rd International Conference on Software Engineering (ICSE).

[46]  Hassan Charaf,et al.  Denormalizing data into schema-free databases , 2013, 2013 IEEE 4th International Conference on Cognitive Infocommunications (CogInfoCom).