User Tools

Site Tools


Sidebar

Practical Information:

Teaching:

Bâtiment Nautibus
43, Bd du 11 Novembre 1918
69622 Villeurbanne Cedex.
☏: +33(0)472 43 16 35
email: marc.plantevit-at-univ-lyon1.fr

Research:

Bureau 501.319
Bâtiment Blaise Pascal
7, Avenue Jean Capelle
69621 Villeurbanne Cedex
☏: +33(0)472 43 84 87
Fax: +33(0)472 43 87 13
email: marc.plantevit-at-liris.cnrs.fr

olfamining

OLFAMINING : Prédiction de la qualité des odeurs à partir de données moléculaires complexes

L'objectif scientifique du projet est d'explorer certains verrous scientifiques dans l'extraction de connaissances dans des bases de données complexes et hétérogènes, en partant d'une application concrète dans le domaine des neurosciences.

Description

L'enjeu applicatif est porté par le Centre de Recherche en Neurosciences de LYON (CRNL), dont la tutelle principale est l'université LYON 1. Le domaine est celui des bases physico-chimiques de la perception de l'odeur. Une équipe du centre a réalisé une collecte inédite d'informations concernant des qualités d'odeur telles que les perçoivent les humains : boisé, fruité, floral, animal, etc… Chacune des ces qualités est associée à un ensemble de molécules odorantes, qu'on nommera « odeurs ». Ces molécules sont connues et entièrement décrites par leurs propriétés physico-chimiques, ainsi que par leur structure 3D. Les objectifs des neurologues sont alors de décrire au mieux ces données par les connaissances implicites qu'elles véhiculent, dans un but à la fois de prédiction et de compréhension des mécanismes :

  • Quelles sont les combinaisons de molécules qui permettent d'obtenir les qualités ou combinaisons de qualité odorantes souhaitées ? Existe-t-il des régularités remarquables au sein des données ?
  • Quelles propriétés physico-chimiques des « odeurs », ou bien sûr combinaisons de propriétés, induisent les qualités ressenties ?
  • Quel est l'impact des propriétés structurelles des molécules ?

Du côté neurosciences, le projet a reçu le soutien de l'ANR et des collectivités. L'appui de l'outil informatique est maintenant nécessaire. Ainsi, pour le LIRIS, l'enjeu est d'importance ; il s'agit de participer à la diffusion de notre savoir faire dans le tissu scientifique local. La santé occupe une place centrale dans l'environnement lyonnais, visible mondialement. Le LIRIS doit saisir toutes les opportunités de démontrer ses compétences dans la gestion et l'exploitation des données, afin de nouer le maximum de collaborations. Ajoutons que les données sont d'ores et déjà disponibles au sein du LIRIS dans une base de données structurée.

Verrous scientifiques (en informatique)

La mise à disposition de ces données constitue une occasion d'illustration de problématiques qui concernent nos activités de recherche.

  • Taille des données : la principale difficulté concerne le nombre de descripteurs, sur lesquels porte l'aspect combinatoire du problème. Il s'agit d'un verrou important qui freine bien souvent le transfert technologique en extraction de connaissances. L'exploration de techniques de réduction ou sélection de variables par la classification pourra se révéler nécessaire. Une étude plus fine de la structure des espaces combinatoires à explorer pourra orienter les recherches.
  • Le jeu de données fournie par les spécialistes de l'olfaction sont particulièrement riches ; mais cette richesse induit une hétérogénéité mettant en difficulté les techniques classiques de fouille de données : bien que génériques, la plupart des algorithmes sont propres à un unique type de données, mais les données de l'application contiennent des attributs booléens, qualitatifs, numériques, mais aussi de type séquences ou graphes.
  • Nous sommes en présence de connaissances sur le domaine d'application (olfaction) et la présence à proximité des experts des données est un atout à exploiter. Si certaines régularités sont connues et qu'il existe des hiérarchies sur les descripteurs, il est toujours difficile à l'heure actuelle de formaliser ces connaissances dans un langage de représentation adéquat utilisable par nos méthodes d'extraction de motifs.
  • En plus des propriétés physico-chimiques, l'ensemble des molécules sont décrites précisément sur le plan structurel ; la problématique sous-jacente est donc l'exploration de graphes 3D encore très peu abordée dans la communauté fouille de données sous-contraintes (en raison du peu de données publiques exploitables, et de l'espace de recherche infini en théorie).

Membres

  • Moustafa Bensafi, Centre de Neurosciences
  • Fabien de Marchi, LIRIS, équipe BD, porteur
  • Mehdi Kaytoue, LIRIS, équipe DM2L
  • Marc Plantevit, LIRIS, équipe DM2L.

Autres Membres

  • Marie Rancon (M1, UCBL1)
  • Rémi Casado (M1, UCBL1)
  • Maxime Izydorczyk (M1, UCBL1)
  • Guillaume Bosc (5IF, INSA-Lyon)
  • Roland Kotto Kombi (M2R, UCBL1)

Résultats

olfamining.txt · Last modified: 2015/01/19 10:20 by mplantev

CNRS INSA de Lyon Université Lyon 1 Université Lyon 2 École centrale de Lyon