User Tools

Site Tools


Sidebar

Practical Information:

Teaching:

Bâtiment Nautibus
43, Bd du 11 Novembre 1918
69622 Villeurbanne Cedex.
☏: +33(0)472 43 16 35
email: marc.plantevit-at-univ-lyon1.fr

Research:

Bureau 501.319
Bâtiment Blaise Pascal
7, Avenue Jean Capelle
69621 Villeurbanne Cedex
☏: +33(0)472 43 84 87
Fax: +33(0)472 43 87 13
email: marc.plantevit-at-liris.cnrs.fr

tiw2_2013_tp2

KNIME : Prise en main, conception et étude de Workflows

KNIME (the Konstanz Information Miner) est une plateforme opensource qui intègre de nombreux composants de Fouille de données et d'apprentissage statistique grâce à des concepts modulaires de workflows. Une interface graphique permet ainsi d'assembler des noeuds pour prétraiter (ETL : Extraction, Transformation, Loading), pour analyser et visualiser des données.

L'objectif de cette séance de TP est de découvrir cette plateforme et toutes les fonctionnalités qu'elle offre principalement au travers d'exemples.

<note important>Un compte rendu par (mo|bi|tri)nôme (TP2-nom1-nom2-nom3.pdf) 1) doit m'être envoyer (marc(dot)plantevit(-at-)univ-lyon1(dot)fr) avant le lundi 25/11/2013, 23h59. </note>

Prise en main

  1. Télécharger et installer KNIME si ce n'est pas déjà fait (dernière question du TP précédent).
  2. Lire le document quickstart pour avoir un rapide aperçu des possibilités offertes par KNIME.
  3. Construire un premier workflow qui lit un jeu de données (de votre choix), le visualise, puis sur lequel on applique un algorithme de Clustering et ensuite on essaie de caractériser chaque cluster via des règles d'association.

Analyse de Workflows

Etudier chacun des workflows suivants (que fait le workflow dans son ensemble, que font chacun des noeuds, etc.) :

  1. Dans KNIME Explorer, le workflow EXAMPLES/050004_lastfm_Recommendations2) Si la connexion ne marche pas, le workflow est disponible ici
  2. Dans KNIME Explorer, le workflow EXAMPLES/008001_ApacheLogFileAnalytics
  3. Un autre workflow de votre choix issu du répertoire distant EXAMPLES3).
  4. Choisir deux workflows parmi ceux présents ici4)
1)
Question 3 de la section prise en main et toutes les autres de la partie Analyse de Workflows
2)
Pour exploiter les workflows présents dans le répertoire distant EXAMPLES, il faut importer le workflow, pour cela, un simple drag-and-drop du workflow dans votre répertoire local est nécessaire.
3)
les noms sont suffisamment explicites
4)
Inutile de recopier les white-papers pour votre analyse.
tiw2_2013_tp2.txt · Last modified: 2013/11/18 09:41 by mplantev

CNRS INSA de Lyon Université Lyon 1 Université Lyon 2 École centrale de Lyon