Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
enseignement:tp:bda:spark:2016 [2016/11/07 20:58] ecoquery |
enseignement:tp:bda:spark:2016 [2016/11/08 08:40] (Version actuelle) ecoquery [Jointure avec Object] |
||
---|---|---|---|
Ligne 2: | Ligne 2: | ||
L' | L' | ||
+ | |||
+ | Ce TP est à faire en binôme (les mêmes que pour le TP Hadoop). | ||
+ | Il est demandé de rendre un rapport décrivant le déroulement du TP et contenant en particulier le code commenté pour le **lundi 14/ | ||
Chaque binôme dispose d'une machine cloud (ip dans tomuus) pour exécuter des job Spark. | Chaque binôme dispose d'une machine cloud (ip dans tomuus) pour exécuter des job Spark. | ||
Ligne 19: | Ligne 22: | ||
</ | </ | ||
- | Récupérer l' | + | Récupérer l' |
Importer les données dans HDFS (dans le répertoire HDFS ''/ | Importer les données dans HDFS (dans le répertoire HDFS ''/ | ||
Ligne 56: | Ligne 59: | ||
* il est également possible de calculer un unique aggrégat comme résultat via '' | * il est également possible de calculer un unique aggrégat comme résultat via '' | ||
* d' | * d' | ||
+ | * schémas: {{: | ||
| | ||
===== Jointure avec Object ===== | ===== Jointure avec Object ===== | ||
Ligne 69: | Ligne 73: | ||
</ | </ | ||
- | Coder cette requête dans Spark. On pourra utiliser la transformation '' | + | Coder cette requête dans Spark. On pourra utiliser la transformation '' |