Table of Contents

TP3 : Mise en oeuvre du processus KDD sur un problème réel

Vous allez mettre en oeuvre les techniques (et d'autres) que vous avez vues dans les précédents TPs sur des problèmes réels.

Deux choix sont possibles :

  1. Choisir un problème sur Kaggle.com et tenter de le résoudre (il faudra soumettre aussi la réponse sur le site afin d'obtenir un score et un classement).
  2. Analyser un jeu de données sur les étangs des Dombes où l'objectif est d'extraire des connaissance pour par exemple, tenter de trouver des explications aux phénomènes de pollution :le jeu de données des Dombes.

Travail attendu

  1. Une fois le jeu de données choisi, vous devez proposer une solution au problème ou trouver des connaissances intéressantes (dans le cas de l'étude des étangs des Dombes).
  2. Vous devez rendre un rapport (maximum 8 pages hors annexes, format pdf) et le code par mail avant le 3/12/2012, 23h59.

Précisions sur le jeu de données des Dombes