Data Mining

Généralités
Intervenants
Emplois du Temps

L'emploi du temps de chaque groupe est disponible sur ADE.

Organisation des CMs
SéanceDateIntervenantContenu
CM123/09/2019FdMIntroduction Processus KDD et itemsets, découverte de motifs fréquents
CM225/09/2019FdMDécouverte de motifs fermés
CM321/10/2019MPDe la découverte de motifs sous contraintes à la découverte interactive de motifs Exercices
CM422/10/2019MPInteractive pattern discovery
CM528/10/2019MPClustering (overview) and algorithms
CC128/10/2019MPExam
TP129/10/2019MPEchantillonnage de motifs (à rendre)
TP218/11/2019MPIntroduction à Knime et Clustering (application à la détection de points d'intérêt)
Projet

L'objectif de ce projet est de mettre en oeuvre une approche complète de fouille de données depuis le prétraitement des données jusqu'à l'évaluation de la méthode de fouille. Vous pouvez utiliser l'outil Knime ou n'importe quel autre outil ou librairie (e.g., Scikit-learn, Weka, MOA). Vous devez donc produire une chaine de traitement mettant en jeu des algorithmes de fouille de données afin de produire de la valeur ajoutée sur les données étudiées. Il est également possible de réaliser un projet centré méthode en implémentant et améliorant un algorithme existant.

Choix des données

Vous pouvez choisir le jeu de données de votre choix (après validation avec un enseignant). Voir par exemple Kaggle pour différents jeux de données.

Organisation du projet

<note>Le rendu du projet (archive) est constitué de :

L'archive est à déposer sur Tomuss (il est possible de mettre des liens vers les sources et la vidéo dans le rapport si trop volumineux).

Date limite de dépôt : 10/01/2020, 23h59 </note>