Article (Scientific journals)
Policy Gradient Algorithms Implicitly Optimize by Continuation
Bolland, Adrien; Louppe, Gilles; Ernst, Damien
2023In Transactions on Machine Learning Research
Peer Reviewed verified by ORBi
 

Files


Full Text
Policy Gradient Algorithms Implicitly Optimize by Continuation.pdf
Publisher postprint (700.17 kB) Creative Commons License - Attribution, Non-Commercial, ShareAlike
Download

All documents in ORBi are protected by a user license.

Send to



Details



Keywords :
Reinforcement Learning; Policy Gradient; Exploration
Disciplines :
Computer science
Author, co-author :
Bolland, Adrien ;  Université de Liège - ULiège > Département d'électricité, électronique et informatique (Institut Montefiore) > Smart grids
Louppe, Gilles  ;  Université de Liège - ULiège > Département d'électricité, électronique et informatique (Institut Montefiore) > Big Data
Ernst, Damien  ;  Université de Liège - ULiège > Département d'électricité, électronique et informatique (Institut Montefiore) > Smart grids ; Telecom Paris, Institut Polytechnique de Paris > Laboratoire Traitement et Communication de l'Information (LTCI)
Language :
English
Title :
Policy Gradient Algorithms Implicitly Optimize by Continuation
Publication date :
21 October 2023
Journal title :
Transactions on Machine Learning Research
eISSN :
2835-8856
Publisher :
OpenReview, Amherst, United States - Massachusetts
Peer reviewed :
Peer Reviewed verified by ORBi
Funders :
F.R.S.-FNRS - Fund for Scientific Research [BE]
Available on ORBi :
since 21 October 2023

Statistics


Number of views
48 (19 by ULiège)
Number of downloads
16 (4 by ULiège)

Bibliography


Similar publications



Contact ORBi