|
|
Publications |
My recent publications are on LIRIS web site.
- Matignon L., Laurent G. & Le Fort-Piat N.: Independent reinforcement learners in cooperative Markov games: a survey regarding coordination problems. The Knowledge Engineering Review, 27(1):1-31, Cambridge University Press, 2012
- Matignon L., Jeanpierre L. & Mouaddib A.-I.: Coordinated Multi-Robot Exploration under Communication Constraints using Decentralized Markov Decision Processes. Proceedings of the 26th AAAI Conference on Artificial Intelligence (AAAI-12), Robotics Track, 2012
- Matignon L., Jeanpierre L. & Mouaddib A.-I.: Distributed Value Functions for the Coordination of Decentralized Decision Makers. Proceedings of the 11th International Conference on Autonomous Agents and Multiagent Systems (AAMAS 2012), Special Track on Robotics, 2012
- Matignon L., Jeanpierre L. & Mouaddib A.-I.: Distributed Value Functions for Multi-Robot Exploration. Proceedings of the International Conference on Robotics and Automation (ICRA'12), 2012
- Burkov A., Matignon L. & Chaib-draa B: Stochastic Games. In O. Sigaud and O. Buffet, editors. Markov Decision Processes and Artificial Intelligence, Wiley - ISTE, 2010
- Matignon L., Laurent G., Le Fort-Piat N. & Y.-A. Chapuis: Designing Decentralized Controllers for Distributed-Air-Jet MEMS-Based Micromanipulators by Reinforcement Learning. Journal of Intelligent and Robotic Systems, 59(2):145?166, DOI 10.1007/s10846-010-9396-9, 2010
- Boutoustous K., Laurent G., Dedu E., Matignon L., Bourgeois J. & Le Fort-Piat N.: Distributed control architecture for smart surfaces. Proceedings of the International Conference on Intelligent Robots and Systems (IROS'10), pp. 2018-2024, 2010
- Matignon L., Karami A. & Mouaddib A.-I.: A Model for Verbal and Non-Verbal Human-Robot Collaboration. Dialog with Robots: AAAI 2010 Fall Symposium Technical Reports, pp.62-67, 2010
- Matignon L., Laurent G., Le Fort-Piat N.: Design of semi-decentralized control laws for distributed-air-jet micromanipulators by reinforcement learning. Proceedings of the International Conference on Intelligent Robots and Systems (IROS'09), pp.3277-3283, 2009
- Matignon L., Laurent G., Le Fort-Piat N.: SOaN : un algorithme pour la coordination d'agents apprenants et non communicants. 4ème Journées Francophones Planification, Décision, Apprentissage pour la conduite de Système (JFPDA'09), pp.115-121, 2009
- Matignon L., Laurent G., Le Fort-Piat N.: Coordination of independent learners in cooperative Markov games.. Rapport Technique Institut Femto-ST, 2009
- Matignon L., Laurent G., Le Fort-Piat N.: Hysteretic Q-Learning : an algorithm for Decentralized Reinforcement Learning in Cooperative Multi-Agent Teams. Proceedings of the International Conference on Intelligent Robots and Systems (IROS'07), pp.64-69, 2007
- Matignon L., Laurent G., Le Fort-Piat N.: Un algorithme décentralisé d'apprentissage par renforcement multi-agents coopératifs : le Q-Learning Hystérétique. 2ème Journées Francophones Planification, Décision, Apprentissage pour la conduite de Système (JFPDA'07), pp.115-121, 2007
- Matignon L., Laurent G., Le Fort-Piat N.: Contrôle distribué d'une Smart surface par Apprentissage par Renforcement. 6èmes Journées Nationales de la Recherche en Robotique (JNRR'07), 2007
- Matignon L., Laurent G., Le Fort-Piat N.: Contrôle distribué d'une Smart Surface par Apprentissage par Renforcement. Ateliers du Laboratoire Européen Associé en Microtechnique (LEA), 2007
- Matignon L., Laurent G., Le Fort-Piat N.: Improving Reinforcement Learning Speed for Robot Control. Proceedings of the International Conference on Intelligent Robots and Systems (IROS'06), pp.3172-3177, 2006
- Matignon L., Laurent G., Le Fort-Piat N.: Reward Function
and Initial Values : Better Choices for Accelerated Goal-Directed Reinforcement Learning. Proceedings of the 16th International Conference on Artificial Neural Networks (ICANN'06), Lecture notes in computer science (LNCS), 1(4131):840-849, 2006
- Matignon L., Laurent G., Le Fort-Piat N.: Choix de la fonction de renforcement et des valeurs initiales pour accélérer l'Apprentissage par Renforcement dans le cadre de problèmes de plus court chemin stochastique. 1ère Journées Francophones Planification, Décision, Apprentissage pour la conduite de Système (JFPDA'06), 2006
- Matignon L.: Injection de connaissance en Apprentissage par Renforcement,. Mémoire de Master, Université de Franche-Comté, 2005
- Matignon L., Laurent G., Le Fort-Piat N.: Injection de connaissances en apprentissage par renforcement. Ateliers du Laboratoire Européen Associé en Microtechnique (LEA), 2005
|
|
|
|