User Tools

Site Tools


Sidebar

Practical Information:

Teaching:

Bâtiment Nautibus
43, Bd du 11 Novembre 1918
69622 Villeurbanne Cedex.
☏: +33(0)472 43 16 35
email: marc.plantevit-at-univ-lyon1.fr

Research:

Bureau 501.319
Bâtiment Blaise Pascal
7, Avenue Jean Capelle
69621 Villeurbanne Cedex
☏: +33(0)472 43 84 87
Fax: +33(0)472 43 87 13
email: marc.plantevit-at-liris.cnrs.fr

2012m2tp3

TP3 : Mise en oeuvre du processus KDD sur un problème réel

Vous allez mettre en oeuvre les techniques (et d'autres) que vous avez vues dans les précédents TPs sur des problèmes réels.

Deux choix sont possibles :

  1. Choisir un problème sur Kaggle.com et tenter de le résoudre (il faudra soumettre aussi la réponse sur le site afin d'obtenir un score et un classement).
  2. Analyser un jeu de données sur les étangs des Dombes où l'objectif est d'extraire des connaissance pour par exemple, tenter de trouver des explications aux phénomènes de pollution :le jeu de données des Dombes.

Travail attendu

  1. Une fois le jeu de données choisi, vous devez proposer une solution au problème ou trouver des connaissances intéressantes (dans le cas de l'étude des étangs des Dombes).
  2. Vous devez rendre un rapport (maximum 8 pages hors annexes, format pdf) et le code par mail avant le 3/12/2012, 23h59.

Précisions sur le jeu de données des Dombes

  • Ce jeu de données contient de nombreux attributs. Tous ne sont pas forcément intéressant. Des valeurs manquantes sont également présentes. Il s'agira donc de bien “nettoyer” le jeu de données avant d'essayer d'en extraire des connaissances.
  • On pourra essayer d'expliquer les valeurs des attributs suivants CHLOROPHYTES, CYANOBACTERIES,chl.a_(µg/L) en fonction des autres (ce sont des marqueurs de pollution).
2012m2tp3.txt · Last modified: 2012/11/18 20:38 by mplantev

CNRS INSA de Lyon Université Lyon 1 Université Lyon 2 École centrale de Lyon