Data Mining

Généralités
  • Master 2 Data Science, semestre d'Automne.
Intervenants
  • CMs (début le 24/09/2018) : Fabien de Marchi et Marc Plantevit (marc(dot)plantevit[at]univ-lyon1.fr)
Emplois du Temps

L'emploi du temps de chaque groupe est disponible sur ADE.

Organisation des CMs
SéanceDateIntervenantContenu
CM124/09/2018FdMIntroduction Processus KDD et itemsets, découverte de motifs fréquents
CM226/09/2018FdMDécouverte de motifs fermés
CM301/10/2018MPDe la découverte de motifs sous contraintes à la découverte interactive de motifs Exercices
TP103/10/2018MPEchantillonnage de motifs (A rendre)
CM422/10/2018MP Partiel , Clustering
CM523/10/2018MP Clustering (suite)
TP229/10/2018MP Détection de points d'intérêts Installer KNIME (si possible avec le plus d'extensions)
CM630/10/2018MPTechniques avancées et suivi de projet
CM719/11/2018MPTechniques avancées et suivi de projet
CM826/11/2018MPTechniques avancées et suivi de projet
EXAM27/11/2018MP Examen Final
Projet

L'objectif de ce projet est de mettre en oeuvre une approche complète de fouille de données depuis le prétraitement des données jusqu'à l'évaluation de la méthode de fouille. Vous pouvez utiliser l'outil Knime ou n'importe quel autre outil ou librairie (e.g., Scikit-learn, Weka, MOA). Vous devez donc produire une chaine de traitement mettant en jeu des algorithmes de fouille de données afin de produire de la valeur ajoutée sur les données étudiées.

Choix des données

Vous pouvez choisir le jeu de données de votre choix (après validation avec un enseignant). Voir par exemple Kaggle pour différents jeux de données.

Organisation du projet
  • Groupe : en (bi/tri/penta)nôme de même parcours (DS INFO, DS Maths, IA).

Le rendu du projet (archive) est constitué de :

  • Un rapport de synthèse (maximum 10 pages hors annexe) résumant vos objectifs, votre approche, etc.
  • Les workflow Knime et/ou scripts finaux.
  • Une vidéo (ou un lien vers) de 3mn maximum qui présente rapidement votre projet.

L'archive est à déposer sur Tomuss (il est possible de mettre des liens vers les sources et la vidéo dans le rapport si trop volumineux).

Date limite de dépôt : XX/XX/201X, 23h59

Les étudiants inscrits en M2 Data Science devront présenter leurs travaux lors d'une soutenance commune à l'UE Machine Learning mi-janvier. L'idée est d'attaquer un jeu de données de différentes façons (DM, ML voire visu).

dm_ds_2017.txt · Last modified: 2018/10/20 08:30 by mplantev
CC Attribution-Noncommercial-Share Alike 3.0 Unported
www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0