Table of Contents

TIW2 : Fouille de Données -- TP3

L'objectif de ce TP est de mettre en application les concepts et les technologies vues précédemment. Pour cela, vous devez choisir un jeu de données parmi les liens suivants1)

Sur le jeu de données considéré, vous devez soit apporter des éléments de réponses par rapport à des questionnements relatifs au jeu de données (contexte), soit trouver par vous même des connaissances intéressantes (créer de la plus value à partir des données). Pour cela, vous pouvez utiliser n'importe quelle méthode de fouille de données ainsi que n'importe quel algorithme ou logiciel (Knime, Sci-Kit Learn (python), Web Api (Google, Bing, Yahoo, …)).

Jeux de données

Jeux de données Tâches possibles
Jeux de données disponibles sur http://www.kaggle.com/les questionnements associés aux données, le choix doit être validé
Jeux de données disponibles sur https://datascience.netles questionnements associés aux données, le choix doit être validé
Autres jeux de données de votre choix, le choix doit être validé

<note important>Le jeu de données (et la tâche) devra être validé le 16/11 ou en début de séance le 23/11. Il peut être également validé par email. </note>

Travail attendu

Vous devez en utilisant les différents concepts vus dans ce cours (mais pas uniquement), produire de la plus-value à partir des données (répondre aux questionnements, découvrir de la connaissance, …). Pour cela, vous pouvez utiliser n'importe quel outil/techno. Il vous est demandé de :

<note important> Le tout devra être remis par email (marc.plantevit-at-liris.cnrs.fr) avant le 23/12/2015 (23h59) 2). </note>

<note important>Vous pouvez travailler en groupe de maximum 5 personnes. Ces groupes seront considérés comme définitifs lors de la validation des sujets (pas d'ajout de dernière minute toléré)

</note>

1)
Il est possible de choisir un autre jeu de données (personnel) mais vous devez obtenir mon accord.
2)
Si l'archive est trop volumineuse, donner un lien pour la télécharger.