Communication publiée dans un ouvrage (Colloques et congrès scientifiques)
A cautious approach to generalization in reinforcement learning
Fonteneau, Raphaël; Murphy, Susan; Wehenkel, Louis et al.
2010In Proceedings of the 2nd International Conference on Agents and Artificial Intelligence
Peer reviewed
 

Documents


Texte intégral
Fonteneau2010ICAART.pdf
Postprint Éditeur (203.77 kB)
Télécharger
Annexes
slides-22January2010@ICAART.pdf
Postprint Éditeur (766.09 kB)
Télécharger
BSPACertificateICAART2010.jpg
Postprint Éditeur (621.05 kB)
Télécharger

Tous les documents dans ORBi sont protégés par une licence d'utilisation.

Envoyer vers



Détails



Mots-clés :
Reinforcement Learning; Prior Knowledge; Cautious Generalization
Résumé :
[en] In the context of a deterministic Lipschitz continuous environment over continuous state spaces, finite action spaces, and a finite optimization horizon, we propose an algorithm of polynomial complexity which exploits weak prior knowledge about its environment for computing from a given sample of trajectories and for a given initial state a sequence of actions. The proposed Viterbi-like algorithm maximizes a recently proposed lower bound on the return depending on the initial state, and uses to this end prior knowledge about the environment provided in the form of upper bounds on its Lipschitz constants. It thereby avoids, in way depending on the initial state and on the prior knowledge, those regions of the state space where the sample is too sparse to make safe generalizations. Our experiments show that it can lead to more cautious policies than algorithms combining dynamic programming with function approximators. We give also a condition on the sample sparsity ensuring that, for a given initial state, the proposed algorithm produces an optimal sequence of actions in open-loop.
Disciplines :
Sciences informatiques
Auteur, co-auteur :
Fonteneau, Raphaël  ;  Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Systèmes et modélisation
Murphy, Susan
Wehenkel, Louis  ;  Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Systèmes et modélisation
Ernst, Damien  ;  Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Systèmes et modélisation
Langue du document :
Anglais
Titre :
A cautious approach to generalization in reinforcement learning
Date de publication/diffusion :
janvier 2010
Nom de la manifestation :
2nd International Conference on Agents and Artificial Intelligence
Organisateur de la manifestation :
Institute for Systems and Technologies of Information, Control and Communication
Lieu de la manifestation :
Valencia, Espagne
Date de la manifestation :
from 22-01-2010 to 24-01-2010
Manifestation à portée :
International
Titre de l'ouvrage principal :
Proceedings of the 2nd International Conference on Agents and Artificial Intelligence
ISBN/EAN :
092312 1713
Pagination :
10
Peer review/Comité de sélection :
Peer reviewed
Organisme subsidiant :
F.R.S.-FNRS - Fonds de la Recherche Scientifique
FRIA - Fonds pour la Formation à la Recherche dans l'Industrie et dans l'Agriculture
Commentaire :
Best Student Paper Award
Disponible sur ORBi :
depuis le 15 février 2010

Statistiques


Nombre de vues
343 (dont 26 ULiège)
Nombre de téléchargements
1093 (dont 15 ULiège)

citations Scopus®
 
3
citations Scopus®
sans auto-citations
0

Bibliographie


Publications similaires



Contacter ORBi