L'influence de la gravité des données dans les architectures des lacs de données

RESUME. La révolution digitale qui met au cœur de sa stratégie la donnée fait émerger le concept de lac de données. Celui-ci devient un composant incontournable pour la découverte de l’information potentiellement enfouie dans les données. Nombre d’industriels qui s’engagent sur cette voie recourent de plus en plus à l’intégration de lacs de données dans leur système d’information et utilisent le plus souvent une plateforme fédératrice, reposant sur la technologie open source « Apache Hadoop ». Cette approche purement industrielle mono technologie commence à trouver ses limites. Dans cet article, nous nous intéressons, d’un point de vue académique, à l’hypothèse de la remise en cause de cette mono technologie par divers facteurs, dont ceux liés à la gravité des données. Nous illustrons notre hypothèse par un cas d’usage en milieu industriel.

[1]  Anne Laurent,et al.  The next information architecture evolution: the data lake wave , 2016, MEDES.

[2]  Hassan H. Alrehamy,et al.  Personal Data Lake with Data Gravity Pull , 2015, 2015 IEEE Fifth International Conference on Big Data and Cloud Computing.