Policy Gradient Algorithms Implicitly Optimize by Continuation

Bolland, Adrien; Louppe, Gilles; Ernst, Damien

Download

Article (Scientific journals)

Policy Gradient Algorithms Implicitly Optimize by Continuation

Bolland, Adrien; Louppe, Gilles; Ernst, Damien

2023 • In Transactions on Machine Learning Research

Peer Reviewed verified by ORBi Dataset

Permalink
https://hdl.handle.net/2268/308036

Files (1)Send to Details Statistics Bibliography Similar publications

Files

Full Text

Policy Gradient Algorithms Implicitly Optimize by Continuation.pdf

Publisher postprint (700.17 kB)

Creative Commons License - Attribution, Non-Commercial, ShareAlike

Download

All documents in ORBi are protected by a user license.

Send to

RIS BibTex APA Chicago Permalink X Linkedin

Details

Keywords :

Reinforcement Learning; Policy Gradient; Exploration

Disciplines :

Computer science

Author, co-author :

Bolland, Adrien ; Université de Liège - ULiège > Département d'électricité, électronique et informatique (Institut Montefiore) > Smart grids

Louppe, Gilles ; Université de Liège - ULiège > Département d'électricité, électronique et informatique (Institut Montefiore) > Big Data

Ernst, Damien ; Université de Liège - ULiège > Département d'électricité, électronique et informatique (Institut Montefiore) > Smart grids ; Telecom Paris, Institut Polytechnique de Paris > Laboratoire Traitement et Communication de l'Information (LTCI)

Language :

English

Title :

Policy Gradient Algorithms Implicitly Optimize by Continuation

Publication date :

21 October 2023

Journal title :

Transactions on Machine Learning Research

eISSN :

2835-8856

Publisher :

OpenReview, Amherst, United States - Massachusetts

Peer reviewed :

Peer Reviewed verified by ORBi

Additional URL :

https://arxiv.org/abs/2305.06851

Funders :

F.R.S.-FNRS - Fonds de la Recherche Scientifique

Data Set :

https://openreview.net/forum?id=3Ba6Hd3nZt

Available on ORBi :

since 21 October 2023

Statistics

Number of views

64 (21 by ULiège)

Number of downloads

24 (5 by ULiège)

More statistics