Table des matières

TP Extract/Transform/Load

Modalités

Ce TP est à réaliser en binômes. Il est demandé de rendre un rapport pour le 06/01/2015 sur spiral contenant:

<note important>Le nom de fichier sera nom1-nom2-edo-tp3-2014-2015.pdf</note>

Introduction

On considère un historique sur 3 ans des subventions aux associations. Les données brutes sont disponibles sur www.data.gouv.fr. Les informations sur les départements et régions des communes sont disponibles dans data-edo.zip.

L'objectif de ce TP est de préparer la construction d'un cube basé sur les données de cette archive. On utilisera pour cela Talend Open Studio for Data Integration.

Faire le mini-tutoriel Talend.

Cube

On souhaite travailler avec les dimensions suivantes:

On souhaite également travailler avec les mesures suivantes:

Travail demandé

Concevoir un schéma relationnel pour contenir les informations de dimensions et de mesures ci-dessus.

Concevoir un job de chargement Talend pour extraire les données des fichiers CSV et les insérer dans votre compte Oracle dans le schéma conçu à l'étape précédente.

<note tip>Pour la connexion à Oracle dans Talend:

</note>