Thèmes : Natural Language Processing, Text Mining,
Encadrant(s) : Marc Plantevit, Maëlle Moranges, Ludovic Moncla, Jacques Fize
Laboratoire : LIRIS
Equipe : DM2L
L’équipe NEUROPOP du Centre de Recherche en Neurosciences de Lyon étudie l’olfaction. Les chercheurs de cette équipe sont intéressés par les descriptions libres des sujets concernant des odeurs senties. Les descriptions sont enregistrées via un dictaphone durant l’expérience. Actuellement tout se fait à la main : dans un premier temps les enregistrements sont retranscrits/traduit par des chercheurs. Dans un second temps, les chercheurs extraits des mots-clés de chacune de ces phrases. Ce prétraitement des données qui se déroule avant l’analyse est long et fastidieux. Il serait apprécié si ces étapes pouvaient être automatisées.
* Montée en compétences sur les méthodes de traitement automatique du langage naturel (NLP) * Automatisation de l'annotation des phrases (déjà écrites) * Evaluation de la méthode proposée
En fonction de l'avancée des étudiants, on pourra imaginer travailler sur le signal audio. Toutefois dans un premier temps, nous nous concentrons sur le texte déjà retranscrit.
Ce projet est pertinent pour les étudiants désirant s'orienter vers les parcours de masters 2 DS et IA.