Ceci est une ancienne révision du document !


Sujets de TER 2012

Prototype de moteur de fouille de données basé sur SAT Modulo Theory

La fouille de données consiste à extraire des informations pertinentes à partir d'un gros volume de données. Un exemple consiste à extraire de données sur les prescriptions des patients les combinaisons de médicaments ayant eu des effets indésirables. Un autre exemple consiste à extraire les combinaisons d'articles achetés souvent ensemble, afin de découvrir les habitudes des clients. De telles combinaisons intéressantes sont appelées motifs.

Depuis quelques années, l'utilisation de la programmation par contraintes afin de découvrir des motifs intéressants à suscité un intérêt dans la communauté scientifique (voir par exemple http://dtai.cs.kuleuven.be/CP4IM/).

L'objectif de ce TER est de mesurer l'apport que peut apporter l'utilisation de solveurs SAT Modulo Theory (SMT) par rapport aux solveurs de contraintes utilisés aujourd'hui dans ce cadre. On débutera par une mise à niveau sur la fouille de données et sur les solveurs SAT et SMT, puis on adaptera à la fouille le solveur OpenSMT.

Amélioration d'un langage de recherche de motifs

RLT [1] est un langage permettant d'exprimer des requêtes pour chercher des motifs intéressants dans des bases de données relationnelles. Une implémentation en Java existe et a permis de faire quelques expérimentations. L'objectif de ce TER est de:

  • Mener une campagne d'expérimentation plus large, avec des requêtes plus réalistes.
  • Étendre le langage avec des construction additionnelles telles que le comptage.

[1] http://liris.cnrs.fr/Documents/Liris-5712.pdf

Ces TER se dérouleront dans le cadre du projet DAG.