Communication publiée dans un ouvrage (Colloques et congrès scientifiques)
Généralisation Min Max pour l'Apprentissage par Renforcement Batch et Déterministe : Relaxations pour le Cas Général T Etapes
Fonteneau, Raphaël; Ernst, Damien; Boigelot, Bernard et al.
2013In 8èmes Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes (JFPDA'13)
Peer reviewed
 

Documents


Texte intégral
JFPDA2013MinMax.pdf
Preprint Auteur (514.25 kB)
Télécharger

Tous les documents dans ORBi sont protégés par une licence d'utilisation.

Envoyer vers



Détails



Mots-clés :
Apprentissage par renforcement; Optimisation non-linéaire
Résumé :
[fr] Cet article aborde le problème de généralisation minmax dans le cadre de l'apprentissage par renforcement batch et déterministe. Le problème a été originellement introduit par [Fonteneau, 2011], et il a déjà été montré qu'il est NP-dur. Deux schémas de relaxation pour le cas deux étapes ont été présentés aux JFPDA'12, et ce papier présente une généralisation de ces schémas au cas T étapes. Le premier schéma fonctionne en éliminant des contraintes afin d'obtenir un problème soluble en temps polynomial. Le deuxième schéma est une relaxation lagrangienne conduisant également à un problème soluble en temps polynomial. On montre théoriquement que ces deux schémas permettent d'obtenir de meilleurs résultats que ceux proposés par [Fonteneau, 2011].
Disciplines :
Sciences informatiques
Auteur, co-auteur :
Fonteneau, Raphaël  ;  Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Systèmes et modélisation
Ernst, Damien  ;  Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Smart grids
Boigelot, Bernard  ;  Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Informatique
Louveaux, Quentin  ;  Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Système et modélisation : Optimisation discrète
Langue du document :
Français
Titre :
Généralisation Min Max pour l'Apprentissage par Renforcement Batch et Déterministe : Relaxations pour le Cas Général T Etapes
Date de publication/diffusion :
2013
Nom de la manifestation :
8èmes Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes (JFPDA'13)
Date de la manifestation :
from 01-07-2013 to 02-07-2013
Titre de l'ouvrage principal :
8èmes Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes (JFPDA'13)
Peer review/Comité de sélection :
Peer reviewed
Disponible sur ORBi :
depuis le 03 juillet 2013

Statistiques


Nombre de vues
164 (dont 9 ULiège)
Nombre de téléchargements
200 (dont 7 ULiège)

Bibliographie


Publications similaires



Contacter ORBi