L'objectif de ce TP est de mettre en application les concepts et les technologies vues précédemment. Pour cela, vous devez choisir un jeu de données parmi les liens suivants1)
Sur le jeu de données considéré, vous devez soit apporter des éléments de réponses par rapport à des questionnements relatifs au jeu de données (contexte), soit trouver par vous même des connaissances intéressantes (créer de la plus value à partir des données). Pour cela, vous pouvez utiliser n'importe quelle méthode de fouille de données ainsi que n'importe quel algorithme ou logiciel (Knime, Sci-Kit Learn (python), Web Api (Google, Bing, Yahoo, …)).
Jeux de données | Tâches possibles |
Corpus Flickr agglomération lyonnaise | identification de points d'intérêts (clustering), caractérisation des points d'intérêts en exploitant les tags, trajectoires, visualisation, etc. 2) |
Jeux de données disponibles sur http://www.kaggle.com/ | les questionnements associés aux données, le choix doit être validé |
Jeux de données disponibles sur https://datascience.net | les questionnements associés aux données, le choix doit être validé |
Vous devez en utilisant les différents concepts vus dans ce cours (mais pas uniquement), produire de la plus-value à partir des données (répondre aux questionnements, découvrir de la connaissance, …). Pour cela, vous pouvez utiliser n'importe quel outil/techno. Il vous est demandé de :
<note important> Le tout devra être remis par email (marc.plantevit-at-liris.cnrs.fr, cc fabien.demarchi-at-liris.cnrs.fr) avant le 21/12/2014 (23h59) 3). </note>