Datamining

[Télécharger les cours]

Module Spécifique - Deuxième Trimestre
Charge Planifiée : 16 heures de cours + 12 de BE

Enseignant responsable : Jean-François Boulicaut


Objectif du Cours

A l'issue de ce module, les étudiant(e)s possèderont une première approche des processus d'extraction de connaissances depuis des bases de données : pré-traitement des données, extraction de propriétés (algorithmes de fouille), post-traitement de ces propriétés afin d'en dériver des connaissances.
L'exposé sera centré sur des connaissances de type "règles" comme par exemple "Quand j'ai les propriétés A et B souvent satisfaites dans mes données alors j'observe aussi la propriété C". De telles règles peuvent êtreutilisées en marketing, en gestion d'alarmes, en épidémiologie, etc. La fouille de données, souventbaptisée "datamining", connaît une expansion fulgurante,au fur et à mesure que les entreprises prennent conscience de la sous-exploitation des données qu'elles collectent et archivent.Il s'agit d'un domaine posant des problèmes techniques difficiles :comment décider du type de connaissance à extraire et de la sélection des données sur lesquelles il faut travailler ?Comment extraire (apprendre) des propriétés depuis des volumesde giga-octets ? Comment identifier parmi les milliers de propriétés extraites celles qui vont effectivement permettre une valeur ajoutée ?
Nous apporterons quelques éléments de réponse.


Sommaire


Activités Pratiques

Un bureau d'étude.


Bibliographie

U.M. Fayyad, G Piatetsky-Spapiro, P. Smyth and R. Uthurusamy Eds.,Advances in knowledge discovery and data mining, AAAI Press-MIT Press (1996)


Contrôle des connaissances

L'évaluation sera réalisée sur la base d'un examen écrit de deux heures et la prise en compte du travail réalisé lors du B.E.