Projet Data Mining

L'objectif de ce projet est de mettre en oeuvre une approche complète de fouille de données depuis le prétraitement des données jusqu'à l'évaluation de la méthode de fouille. Vous pouvez utiliser l'outil Knime ou n'importe quel autre outil ou librairie (e.g., Scikit-learn, Weka, MOA, prototypes). Vous devez donc produire une chaîne de traitement mettant en jeu des algorithmes de fouille de données afin de produire de la valeur ajoutée sur les données étudiées. Il est également possible de réaliser d'autres types de projets comme par exemple un projet centré méthode en implémentant et améliorant un algorithme existant ou encore un projet de sensibilisation aux données personnelles pour le grand public (e.g. faire un workflow qui à partir des données personnelles d'un individu (e.g. données google) reconstruise son emploi du temps, ses points d'intérêt, …).

Choix des données

Vous pouvez choisir le jeu de données de votre choix (après validation avec un enseignant). Voir par exemple Kaggle pour différents jeux de données.

Livrables
Le rapport
Code et données
La vidéo
Ce qui doit être fait à l'issue de la première séance
Echéances

Les livrables seront à rendre sur Tomuss dans les colonnes dédiées :