User Tools

Site Tools


Sidebar

Practical Information:

Teaching:

Bâtiment Nautibus
43, Bd du 11 Novembre 1918
69622 Villeurbanne Cedex.
☏: +33(0)472 43 16 35
email: marc.plantevit-at-univ-lyon1.fr

Research:

Bureau 501.319
Bâtiment Blaise Pascal
7, Avenue Jean Capelle
69621 Villeurbanne Cedex
☏: +33(0)472 43 84 87
Fax: +33(0)472 43 87 13
email: marc.plantevit-at-liris.cnrs.fr

prim1314olfamining1

Fouille de données olfactives

Caractérisation de qualités d'odeurs

Encadrants : Fabien de Marchi (Fabien(dot)deMarchi(-AT-)liris.cnrs.fr), Marc Plantevit (Marc(dot)Plantevit(-AT-)liris.cnrs.fr), et Mehdi Kaytoue (Mehdi(dot)Kaytoue(-AT-)liris.cnrs.fr)

Contexte

L'enjeu applicatif est porté par le Centre de Recherche en Neurosciences de LYON (CRNL). Le domaine est celui des bases physico-chimiques de la perception de l'odeur. Une équipe du centre a réalisé une collecte inédite d'informations concernant des qualités d'odeur telles que les perçoivent les humains : boisé, fruité, floral, animal, etc… Chacune des ces qualités est associée à un ensemble de molécules odorantes, qu'on nommera « odeurs ». Ces molécules sont connues et entièrement décrites par leurs propriétés physico-chimiques, ainsi que par leur structure 3D. Les objectifs des neurologues sont alors de décrire au mieux ces données par les connaissances implicites qu'elles véhiculent, dans un but à la fois de prédiction et de compréhension des mécanismes :

  • Quelles sont les combinaisons de molécules qui permettent d'obtenir les qualités ou combinaisons de qualité odorantes souhaitées ? Existe-t-il des régularités remarquables au sein des données ?
  • Quelles propriétés physico-chimiques des « odeurs », ou bien sûr combinaisons de propriétés, induisent les qualités ressenties ?
  • Quel est l'impact des propriétés structurelles des molécules ?

Verrous scientifiques en informatique

La mise à disposition de ces données constitue une occasion d'illustration de problématiques qui concernent les activités de recherche développées au sein des équipes BD et DM2L du LIRIS. Ce projet de recherche s'attaquera notamment aux suivantes :

  • Taille des données :   la principale difficulté concerne le nombre de descripteurs, sur lesquels porte l'aspect combinatoire du problème. Il s'agit d'un verrou important qui freine bien souvent le transfert technologique en extraction de connaissances. L'exploration de techniques de réduction ou sélection de variables par la classification pourra se révéler nécessaire. Une étude plus fine de la structure des espaces combinatoires à explorer pourra orienter les recherches.
  • Le jeu de données fournie par les spécialistes de l'olfaction sont particulièrement riches ; mais cette richesse induit une hétérogénéité mettant en difficulté les techniques classiques de fouille de données : bien que génériques, la plupart des algorithmes sont propres à un unique type de données, mais les données de l'application contiennent des attributs booléens, qualitatifs, numériques, mais aussi de type séquences ou graphes.

Travail demandé

Tout d'abord, il s'agira de se familiariser avec les notions classiques de fouilles de motifs (ensemblistes). Il sera ensuite demandé de tester les algorithmes existants afin d'évaluer leurs limites sur de telles données; l'objectif final étant de proposer une approche pour la découverte de motifs caractérisant des qualités d'odeurs, permettant de mieux d'appréhender le grand nombre de descripteurs dans les données et apportant des éléments de réponse aux questions précédentes.

Informations complémentaires

  • Les langages de programmation utilisés seront C++ (Java dans une moindre mesure).
  • Ce projet de recherche est parfaitement adapté pour des poursuites d'études en M2TI/TIW et M2IADE.
prim1314olfamining1.txt · Last modified: 2013/10/16 15:17 by mplantev

CNRS INSA de Lyon Université Lyon 1 Université Lyon 2 École centrale de Lyon