Annotation semi-automatique de phrases issues d'expériences en Neurosciences

Thèmes : Natural Language Processing, Text Mining,

Encadrant(s) : Marc Plantevit, Maëlle Moranges, Ludovic Moncla, Jacques Fize

Laboratoire : LIRIS

Equipe : DM2L

Contexte et Objectif

L’équipe NEUROPOP du Centre de Recherche en Neurosciences de Lyon étudie l’olfaction. Les chercheurs de cette équipe sont intéressés par les descriptions libres des sujets concernant des odeurs senties. Les descriptions sont enregistrées via un dictaphone durant l’expérience. Actuellement tout se fait à la main : dans un premier temps les enregistrements sont retranscrits/traduit par des chercheurs. Dans un second temps, les chercheurs extraits des mots-clés de chacune de ces phrases. Ce prétraitement des données qui se déroule avant l’analyse est long et fastidieux. Il serait apprécié si ces étapes pouvaient être automatisées.

Travail demandé

* Montée en compétences sur les méthodes de traitement automatique du langage naturel (NLP)
* Automatisation de l'annotation des phrases (déjà écrites)
* Evaluation de la méthode proposée

En fonction de l'avancée des étudiants, on pourra imaginer travailler sur le signal audio. Toutefois dans un premier temps, nous nous concentrons sur le texte déjà retranscrit.

Informations complémentaires

Ce projet est pertinent pour les étudiants désirant s'orienter vers les parcours de masters 2 DS et IA.