L'objectif de ce TP est de mettre en application les concepts et les technologies vues précédemment. Pour cela, vous devez choisir un jeu de données parmi les liens suivants1)
Sur le jeu de données considéré, vous devez soit apporter des éléments de réponses par rapport à des questionnements relatifs au jeu de données (contexte), soit trouver par vous même des connaissances intéressantes (créer de la plus value à partir des données). Pour cela, vous pouvez utiliser n'importe quelle méthode de fouille de données ainsi que n'importe quel algorithme ou logiciel (Knime, Sci-Kit Learn (python), Web Api (Google, Bing, Yahoo, …)).
Jeux de données | Tâches possibles |
Jeux de données disponibles sur http://www.kaggle.com/ | les questionnements associés aux données, le choix doit être validé |
Jeux de données disponibles sur https://datascience.net | les questionnements associés aux données, le choix doit être validé |
Autres jeux de données de votre choix, le choix doit être validé |
<note important>Le jeu de données (et la tâche) devra être validé le 16/11 ou en début de séance le 23/11. Il peut être également validé par email. </note>
Vous devez en utilisant les différents concepts vus dans ce cours (mais pas uniquement), produire de la plus-value à partir des données (répondre aux questionnements, découvrir de la connaissance, …). Pour cela, vous pouvez utiliser n'importe quel outil/techno. Il vous est demandé de :
<note important> Le tout devra être remis par email (marc.plantevit-at-liris.cnrs.fr) avant le 23/12/2015 (23h59) 2). </note>
<note important>Vous pouvez travailler en groupe de maximum 5 personnes. Ces groupes seront considérés comme définitifs lors de la validation des sujets (pas d'ajout de dernière minute toléré)
</note>