User Tools

Site Tools


Sidebar

Practical Information:

Teaching:

Bâtiment Nautibus
43, Bd du 11 Novembre 1918
69622 Villeurbanne Cedex.
☏: +33(0)472 43 16 35
email: marc.plantevit-at-univ-lyon1.fr

Research:

Bureau 501.319
Bâtiment Blaise Pascal
7, Avenue Jean Capelle
69621 Villeurbanne Cedex
☏: +33(0)472 43 84 87
Fax: +33(0)472 43 87 13
email: marc.plantevit-at-liris.cnrs.fr

tiw2_2015_tp3

This is an old revision of the document!


Table of Contents

TIW2 : Fouille de Données -- TP3

L'objectif de ce TP est de mettre en application les concepts et les technologies vues précédemment. Pour cela, vous devez choisir un jeu de données parmi les liens suivants1)

Sur le jeu de données considéré, vous devez soit apporter des éléments de réponses par rapport à des questionnements relatifs au jeu de données (contexte), soit trouver par vous même des connaissances intéressantes (créer de la plus value à partir des données). Pour cela, vous pouvez utiliser n'importe quelle méthode de fouille de données ainsi que n'importe quel algorithme ou logiciel (Knime, Sci-Kit Learn (python), Web Api (Google, Bing, Yahoo, …)).

Jeux de données

Jeux de données Tâches possibles
Jeux de données disponibles sur http://www.kaggle.com/les questionnements associés aux données, le choix doit être validé
Jeux de données disponibles sur https://datascience.netles questionnements associés aux données, le choix doit être validé
Autres jeux de données de votre choix, le choix doit être validé

<note important>Le jeu de données (et la tâche) devra être validé le 16/11 ou en début de séance le 23/11. Il peut être également validé par email. </note>

Travail attendu

Vous devez en utilisant les différents concepts vus dans ce cours (mais pas uniquement), produire de la plus-value à partir des données (répondre aux questionnements, découvrir de la connaissance, …). Pour cela, vous pouvez utiliser n'importe quel outil/techno. Il vous est demandé de :

  • Rendre un rapport (au format pdf) décrivant le travail réalisé;
  • Remettre une archive des traitements effectués;
  • Une présentation à mi-parcours est également prévue le 10/12/2015 (modalités à suivre)
  • Réaliser une video de présentation de votre projet (maximum 5 minutes).

<note important> Le tout devra être remis par email (marc.plantevit-at-liris.cnrs.fr) avant le 20/12/2015 (23h59) 2). </note>

<note important>Vous pouvez travailler en groupe de maximum 5 personnes. Ces groupes seront considérés comme définitifs lors de la validation des sujets (pas d'ajout de dernière minute toléré)

  • travail attendu = f(|groupe|) avec f strictement croissante.

</note>

1)
Il est possible de choisir un autre jeu de données (personnel) mais vous devez obtenir mon accord.
2)
Si l'archive est trop volumineuse, donner un lien pour la télécharger.
tiw2_2015_tp3.1447662534.txt.gz · Last modified: 2015/11/16 09:28 by mplantev

CNRS INSA de Lyon Université Lyon 1 Université Lyon 2 École centrale de Lyon