Table of Contents

TIW2 : Fouille de Données -- TP3

L'objectif de ce TP est de mettre en application les concepts et les technologies vues précédemment. Pour cela, vous devez choisir un jeu de données parmi les liens suivants1)

Sur le jeu de données considéré, vous devez soit apporter des éléments de réponses par rapport à des questionnements relatifs au jeu de données (contexte), soit trouver par vous même des connaissances intéressantes (créer de la plus value à partir des données). Pour cela, vous pouvez utiliser n'importe quelle méthode de fouille de données ainsi que n'importe quel algorithme ou logiciel (Knime, Sci-Kit Learn (python), Web Api (Google, Bing, Yahoo, …)).

Jeux de données

Jeux de données Tâches possibles
Corpus Flickr agglomération lyonnaiseidentification de points d'intérêts (clustering), caractérisation des points d'intérêts en exploitant les tags, trajectoires, visualisation, etc. 2)
Jeux de données disponibles sur http://www.kaggle.com/les questionnements associés aux données, le choix doit être validé
Jeux de données disponibles sur https://datascience.netles questionnements associés aux données, le choix doit être validé

Travail attendu

Vous devez en utilisant les différents concepts vus dans ce cours (mais pas uniquement), produire de la plus-value à partir des données (répondre aux questionnements, découvrir de la connaissance, …). Pour cela, vous pouvez utiliser n'importe quel outil/techno. Il vous est demandé de :

<note important> Le tout devra être remis par email (marc.plantevit-at-liris.cnrs.fr, cc fabien.demarchi-at-liris.cnrs.fr) avant le 21/12/2014 (23h59) 3). </note>

1)
Il est possible de choisir un autre jeu de données (personnel) mais vous devez obtenir mon accord.
2)
un exemple de traitement fait par un étudiant de M1 en TER est disponible ici.
3)
Si l'archive est trop volumineuse, donner un lien pour la télécharger.