Rachelson, Emmanuel and Fabiani, Patrick and Garcia, Frédérick
Un Algorithme Amélioré d'Itération de la Politique Approchée pour les Processus Décisionnels Semi-Markoviens Généralisés.
(2008)
In: Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes (JFPDA 2008), 19 June 2008 - 20 June 2008 (Metz, France).
|
(Document in English)
PDF (Author's version) - Requires a PDF viewer such as GSview, Xpdf or Adobe Acrobat Reader 304kB |
Abstract
La complexité des problèmes de décision dans l'incertain dépendant du temps provient sou-vent de l'interaction de plusieurs processus concurrents. Les Processus Décisionnels Semi-Markoviens Généralisés (GSMDP) consituent un formalisme efficace et élégant pour représenter à la fois les aspects de concurrence d'événements et d'actions et d'incertitude. Nous proposons un formalisme GSMDP étendu à un temps observable et un espace d'états hybride. Sur cette base, nous introduisons un nouvel algorithme inspiré de l'itération de la politique approchée afin de construire des politiques efficaces. Cet algorithme repose sur une exploration guidée par la simulation et utilise les techniques d'appren-tissage à vecteurs supports. Nous illustrons cet algorithme sur un exemple et en proposons une version améliorée qui compense sa principale faiblesse.
Item Type: | Conference or Workshop Item (Paper) |
---|---|
Audience (conference): | National conference proceedings |
Uncontrolled Keywords: | |
Institution: | French research institutions > Institut National de la Recherche Agronomique - INRA (FRANCE) French research institutions > Office National d'Etudes et Recherches Aérospatiales - ONERA (FRANCE) |
Laboratory name: | |
Statistics: | download |
Deposited On: | 29 Nov 2017 14:54 |
Repository Staff Only: item control page