Véronique Deslandres

Depuis 2013 notamment avec la thèse de Simon PAGEAUD, nous faisons de l'apprentissage par renforcement et du Deep Learning (IQN DRL) dans un cadre décentralisé partiellement observable (dec-POMDP). Nous avons mis au point une stratégie d’apprentissage par renforcement profond multi-agents, multi-niveaux avec un nouvel algorithme appelé Clustered Deep Q-Network (CDQN). Ce double niveau, ainsi qu’une stratégie basée sur un score de confiance, permet à des agents de contrôle de répartir au mieux les agents politiques responsables des décisions d’action, en clusters indépendants, pour proposer des politiques optimales.

La répartition en clusters indépendants répond au problème bien connu de non-stationnarité de l'environnement, et des limites en termes d'experience replay des algorithmes d’apprentissage multi-agents (AAMAS 2019, rang A* et APIA 2019).

J'ai aussi travaillé par le passé sur les méthodes de classification non supervisées pour l'apprentissage automatique, avec la thèse d'Haytham ELGHAZEL (2007). Nous avons élaboré une méthode de clustering basée sur la théorie des graphes, qui exploite les propriétés de la b-coloration. Ces travaux ont été appliqués au cas des données médicales (données hétérogènes, taxonomies et arborescences) lors d'un projet régional DOMECAD. Nous avons aussi collaboré avec le Pr T. Yoshida d'Hokkaido University, Japon, sur une version incrémentale de la méthode avec un algorithme glouton. Nous avons testé nos approches sur des données médicales réelles et des benchmarks d'UCI.

Véronique Deslandres

Outils pour utilisateurs

Outils du site

Panneau latéral

Outils de la page