Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
enseignement:tp:bda:hadoop:tp2:2016 [2016/10/21 07:31] ecoquery [Données et requête] |
enseignement:tp:bda:hadoop:tp2:2016 [2016/10/21 14:21] (Version actuelle) ecoquery [Données et requête] |
||
---|---|---|---|
Ligne 21: | Ligne 21: | ||
On considère le jeu de données du TP précédent, | On considère le jeu de données du TP précédent, | ||
- | On souhaite répondre à la question suivante: calculer pour chaque objet observé avant le point temporel ('' | + | On souhaite répondre à la question suivante: calculer pour chaque objet observé avant le point temporel ('' |
< | < | ||
SELECT o.objectId, count(*) as cnt, avg(flux_Gaussian) flxG_avg | SELECT o.objectId, count(*) as cnt, avg(flux_Gaussian) flxG_avg | ||
FROM Source s join Object o ON s.objectId = o.objectId | FROM Source s join Object o ON s.objectId = o.objectId | ||
- | WHERE earliestObsTime <= 50980.0 -- AND s.objectId IS NOT NULL | + | WHERE earliestObsTime <= 50985.0 -- AND s.objectId IS NOT NULL |
GROUP BY o.objectId | GROUP BY o.objectId | ||
</ | </ | ||
Il y a deux possibilités pour répondre à cette requête: effectuer une jointure en utilisant la valeur de l' | Il y a deux possibilités pour répondre à cette requête: effectuer une jointure en utilisant la valeur de l' | ||
+ | |||
+ | |||
+ | Si on se limite au contenu des fichiers '' | ||
===== Jointure via la clé de shuffle/ | ===== Jointure via la clé de shuffle/ |