L'objectif de ce TP est de mettre techniquement en place la réplication, puis dans un 2eme temps la distribution des données en MongoDB. A cette fin 3 machines virtuelles supplémentaires vous seront attribuées.
Mettre en place une réplication sur 3 machines de la collection zips du TP précédent.
Effectuer un test de charge à partir de la quatrième machine, montrant l'intérêt de la réplication en termes de performances pour la lecture. On pourra effectuer ce test pour différents types de requêtes: sélections simples, pipeline map/reduce, aggregation pipeline. On s'intéressera en particulier à des requêtes pouvant avoir du sens au sein d'un cube de données.
Pour cette partie, on défera la configuration de réplication. On configurera ensuite les machine de façon à distribuer les données sur 2 machines. On expliquera les compromis nécessaires vis-à-vis de la configuration recommandée dans la documentation.
On envisagera plusieurs critères de partitionnement des données et on commentera sur leur pertinence.
On rendra un rapport au format pdf expliquant:
Le rapport est à rendre avant le prochain TP (le 23/01/2015 à 10h) sur spiral.