Reference : Apprentissage par renforcement batch fondé sur la reconstruction de trajectoires arti...
Scientific congresses and symposiums : Paper published in a book
Engineering, computing & technology : Computer science
http://hdl.handle.net/2268/166453
Apprentissage par renforcement batch fondé sur la reconstruction de trajectoires artificielles
French
Fonteneau, Raphaël mailto [Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Systèmes et modélisation >]
Murphy, Susan A. []
Wehenkel, Louis mailto [Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Systèmes et modélisation >]
Ernst, Damien mailto [Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Smart grids >]
2014
Proceedings of the 9èmes Journées Francophones de Planification, Décision et Apprentissage (JFPDA 2014)
Yes
No
International
9èmes Journées Francophones de Planification, Décision et Apprentissage (JFPDA 2014)
12-13 mai 2014
[en] Apprentisssage par renforcement
[en] Cet article se situe dans le cadre de l’apprentissage par renforcement en mode batch, dont le problème central est d’apprendre, à partir d’un ensemble de trajectoires, une politique de décision optimisant un critère donné. On considère plus spécifiquement les problèmes pour lesquels l’espace d’état est continu, problèmes pour lesquels les schémas de résolution classiques se fondent sur l’utilisation d’approxima- teurs de fonctions. Cet article propose une alternative fondée sur la reconstruction de “trajectoires arti- ficielles” permettant d’aborder sous un angle nouveau les problèmes classiques de l’apprentissage par renforcement batch.
Researchers ; Professionals ; Students
http://hdl.handle.net/2268/166453

File(s) associated to this reference

Fulltext file(s):

FileCommentaryVersionSizeAccess
Open access
Fonteneau2014JFPDA_ArtTraj.pdfAuthor preprint561.63 kBView/Open

Bookmark and Share SFX Query

All documents in ORBi are protected by a user license.