User Tools

Site Tools


Sidebar

Practical Information:

Teaching:

Bâtiment Nautibus
43, Bd du 11 Novembre 1918
69622 Villeurbanne Cedex.
☏: +33(0)472 43 16 35
email: marc.plantevit-at-univ-lyon1.fr

Research:

Bureau 501.319
Bâtiment Blaise Pascal
7, Avenue Jean Capelle
69621 Villeurbanne Cedex
☏: +33(0)472 43 84 87
Fax: +33(0)472 43 87 13
email: marc.plantevit-at-liris.cnrs.fr

projet_dm_2020

Projet Data Mining

L'objectif de ce projet est de mettre en oeuvre une approche complète de fouille de données depuis le prétraitement des données jusqu'à l'évaluation de la méthode de fouille. Vous pouvez utiliser l'outil Knime ou n'importe quel autre outil ou librairie (e.g., Scikit-learn, Weka, MOA, prototypes). Vous devez donc produire une chaîne de traitement mettant en jeu des algorithmes de fouille de données afin de produire de la valeur ajoutée sur les données étudiées. Il est également possible de réaliser d'autres types de projets comme par exemple un projet centré méthode en implémentant et améliorant un algorithme existant ou encore un projet de sensibilisation aux données personnelles pour le grand public (e.g. faire un workflow qui à partir des données personnelles d'un individu (e.g. données google) reconstruise son emploi du temps, ses points d'intérêt, …).

Choix des données

Vous pouvez choisir le jeu de données de votre choix (après validation avec un enseignant). Voir par exemple Kaggle pour différents jeux de données.

Livrables
  • Un rapport
  • Le code et les données
  • Une vidéo de vulgarisation
Le rapport
  • 15 pages hors annexe(s) format pdf
  • Plan conseillé : Introduction / Présentation des données, statistiques et analyses préliminaires / Question(s) que l'on souhaite répondre / Méthode / Résultats / Discussion, Conclusion.
Code et données
  • Soit donner un pointeur vers une dépôt, soit une archive
  • Bien documenter le code
  • Un README doit être présent permettant d'exécuter aisément le code
La vidéo
  • 3 minutes environ
  • Fournir la vidéo ou un lien vers la vidéo.
Ce qui doit être fait à l'issue de la première séance
  • Composition des groupes (5 étudiants max par groupe)
  • Création d'un sous-channel dédié dans TIW9-DCD sous discord.
  • Identification et validation du jeu de données/tâche par l'enseignant.
  • des pointeurs vers des prototypes / méthodes vous seront donnés en fonction des traitements que vous souhaitez faire .
Echéances

Les livrables seront à rendre sur Tomuss dans les colonnes dédiées :

  • Rapport : 22/01/2021
  • Code : 22/01/2021
  • Vidéo : 22/01/2021
projet_dm_2020.txt · Last modified: 2020/11/30 10:46 by mplantev

CNRS INSA de Lyon Université Lyon 1 Université Lyon 2 École centrale de Lyon