Outils pour utilisateurs

Outils du site


start

Présentation

AUBRET Arthur
Doctorant, équipe SMA
LIRIS, Université Claude Bernard Lyon 1

Sujet de thèse

Apprentissage par renforcement de compétences pour la coordination multi-agents

Résumé

En apprentissage par renforcement, un agent apprend par essais-erreurs à maximiser l’espérance des récompenses reçues suite aux actions effectuées dans son environnement. Dans une scénario multi-agents, des tâches peuvent nécessiter que plusieurs agents coopèrent ; or, malgré de récentes avancées en apprentissage profond par renforcement, il est difficile de synchroniser les agents, particulièrement quand le nombre d'agents est important. La communication est un moyen efficace de synchroniser les agents, cependant les modèles actuels permettent de communiquer seulement les informations contenues dans les observations et considèrent des scénarios avec peu d'agents. Pour adresser ces problèmes, nous souhaitons tirer parti des récents travaux sur la motivation intrinsèque.

Dans un premier temps, nous voulons rendre nos agents capables de communiquer leurs intentions en plus de leurs observations, pour cela, ils doivent apprendre à construire une représentations de leurs compétences. Dans un second temps, notre objectif est que les agents apprennent quoi communiquer, puis quand et à qui le communiquer.

Encadrement

Encadrante : MATIGNON Laetitia
Directrice de thèse : HASSAS Salima

Contact

LIRIS
Bâtiment Nautibus
Université Claude Bernard Lyon 1
43 Boulevard du 11 Novembre 1918
69622 Villeurbanne Cedex

Email : arthur.aubret@liris.cnrs.fr

start.txt · Dernière modification: 2019/04/17 14:29 de aaubret

Outils de la page