Datamining
[Télécharger les
cours]
Module Spécifique - Deuxième
Trimestre
Charge Planifiée : 16 heures de cours + 12 de BE
Enseignant responsable : Jean-François Boulicaut
Objectif du Cours
A l'issue de ce
module, les étudiant(e)s possèderont une première
approche des processus d'extraction de connaissances depuis des bases de
données : pré-traitement des données, extraction de
propriétés (algorithmes de fouille), post-traitement de ces
propriétés afin d'en dériver des connaissances.
L'exposé sera centré sur des connaissances de type
"règles" comme par exemple "Quand j'ai les propriétés A
et B souvent satisfaites dans mes données alors j'observe aussi la
propriété C". De telles règles peuvent
êtreutilisées en marketing, en gestion d'alarmes, en
épidémiologie, etc. La fouille de données,
souventbaptisée "datamining", connaît une expansion fulgurante,au
fur et à mesure que les entreprises prennent conscience de la
sous-exploitation des données qu'elles collectent et archivent.Il
s'agit d'un domaine posant des problèmes techniques difficiles :comment
décider du type de connaissance à extraire et de la
sélection des données sur lesquelles il faut travailler ?Comment
extraire (apprendre) des propriétés depuis des volumesde
giga-octets ? Comment identifier parmi les milliers de
propriétés extraites celles qui vont effectivement permettre une
valeur ajoutée ?
Nous apporterons quelques éléments
de réponse.
Sommaire
Activités Pratiques
Un bureau
d'étude.
Bibliographie
U.M. Fayyad, G Piatetsky-Spapiro, P. Smyth and R.
Uthurusamy Eds.,Advances in knowledge discovery and data mining, AAAI
Press-MIT Press (1996)
Contrôle des
connaissances
L'évaluation sera réalisée sur la base
d'un examen écrit de deux heures et la prise en compte du travail
réalisé lors du B.E.