User Tools

Site Tools


tiw2_2014_tp3

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Next revision Both sides next revision
tiw2_2014_tp3 [2014/11/27 10:37]
mplantev created
tiw2_2014_tp3 [2014/11/27 11:29]
mplantev
Line 3: Line 3:
  
  
-Sur le jeu de données considéré, vous  devez soit apporter des éléments de réponses par rapport à des questionnements relatifs au jeu de données (contexte), soit trouver par vous même des connaissances intéressantes (créer de la plus value à partir des données).  Pour cela, vous pouvez utiliser n'importe quelle méthode  de fouille de données ainsi que n'importe quel algorithme ou logiciel.+Sur le jeu de données considéré, vous  devez soit apporter des éléments de réponses par rapport à des questionnements relatifs au jeu de données (contexte), soit trouver par vous même des connaissances intéressantes (créer de la plus value à partir des données).  Pour cela, vous pouvez utiliser n'importe quelle méthode  de fouille de données ainsi que n'importe quel algorithme ou logiciel (Knime, Sci-Kit Learn (python), Web Api (Google, Bing, Yahoo, …)).
  
  
-<note important>Rendre une archive contenant un compte rendu ainsi que les traitements effectués (e.g., sauvegarde d'un workflow si travaux effectués sous Knime). Attention, faites bien figurer un lien vers le jeu de données original. Les méthodes utilisées doivent être justifiées.  Cette archive devra m'être envoyée par mail avant le 19/12/2014 (23h59). </note>+===== Jeux de données =====
  
 +|Jeux de données | Tâches possibles|
 +|[[http://liris.cnrs.fr/~mplantev/ENS/TP/flickr-dataset-original.zip|Corpus Flickr agglomération lyonnaise]]|identification de points d'intérêts (clustering), caractérisation des points d'intérêts en exploitant les tags, trajectoires, visualisation, etc. ((un exemple de traitement fait par un étudiant de M1 en TER est disponible [[http://liris.cnrs.fr/~mkaytoue/teaching/datamining/flickr/flickr-illustrations.pdf|ici]].)) |
 +|Jeux de données disponibles sur [[http://www.kaggle.com/]]|les questionnements associés aux données, ** le choix doit être validé  **|
 +|Jeux de données disponibles sur [[https://datascience.net]]|les questionnements associés aux données, ** le choix doit être validé  **|
 + 
 +
 +
 +
 +===== Travail attendu =====
 +
 +Vous devez en utilisant les différents concepts vus dans ce cours (mais pas uniquement), produire de la plus-value à partir des données (répondre aux questionnements, découvrir de la connaissance, ...). Pour cela, vous pouvez utiliser n'importe quel outil/techno. 
 +
 +
 +
 +
 +
 +<note important>Rendre une archive contenant un compte rendu ainsi que les traitements effectués (e.g., sauvegarde d'un workflow si travaux effectués sous Knime). Attention, faites bien figurer un lien vers le jeu de données original. Les méthodes utilisées doivent être justifiées.  Cette archive devra m'être envoyée par mail avant le 19/12/2014 (23h59). </note>
tiw2_2014_tp3.txt · Last modified: 2014/11/27 12:49 by mplantev

CNRS INSA de Lyon Université Lyon 1 Université Lyon 2 École centrale de Lyon