Drougard, Nicolas and Teichteil-Konigsbuch, Florent and Farges, Jean-Loup and Dubois, Didier Processus décisionnels de Markov possibilités à observabilité mixte. (2015) Revue d'Intelligence Artificielle, 29 (6). 629-653. ISSN 0992-499X
|
(Document in English)
PDF (Author's version) - Requires a PDF viewer such as GSview, Xpdf or Adobe Acrobat Reader 436kB |
Official URL: http://dx.doi.org/10.3166/RIA.29.629-653
Abstract
Les processus décisionnels de Markov partiellement observables possibilistes qualita- tifs (π-PDMPO) constituent une alternative aux PDMPO classiques (probabilistes) : ils sont utilisés dans les situations où l’état de croyance initial de l’agent et les probabilités définissant le problème sont imprécises du fait d’un manque de connaissance ou de données. Cependant, tout comme les PDMPO, le calcul d’une stratégie optimale demande un grand nombre d’opé- rations : le nombre d’états de croyance grandit exponentiellement avec le nombre d’états du système. Dans cet article, une version possibiliste des processus décisisionnels de Markov à observabilité mixte est présentée pour simplifier ce calcul : la complexité de résolution d’un π-PDMPO, dont certaines variables d’état sont complètement observables, peut être consi- dérablement réduite. Un algorithme d’itération sur les revenus optimaux pour cette nouvelle formulation est ensuite proposé pour le cas de l’horizon infini, et l’optimalité de la stratégie calculée pour un critère donné est démontrée, lorsqu’il existe une action "rester" dans certains états buts. Les expérimentations montrent finalement que ce modèle possibiliste est plus perfor- mant que le modèle PDMPO probabiliste, utilisé classiquement en robotique, pour un problème de reconnaissance de cible, dans certaines situations où les capacités d’observation de l’agent ne sont pas précises.
Item Type: | Article |
---|---|
Additional Information: | Thanks to Lavoisier editor. This papers appears in volume 29 of Revue d'Intelligence Artificielle ISSN 0992-499X The original PDF is available at: http://ria.revuesonline.com/article.jsp?articleId=35834 |
HAL Id: | hal-01530407 |
Audience (journal): | International peer-reviewed journal |
Uncontrolled Keywords: | |
Institution: | French research institutions > Centre National de la Recherche Scientifique - CNRS (FRANCE) Université de Toulouse > Institut National Polytechnique de Toulouse - Toulouse INP (FRANCE) French research institutions > Office National d'Etudes et Recherches Aérospatiales - ONERA (FRANCE) Université de Toulouse > Université Toulouse III - Paul Sabatier - UT3 (FRANCE) Université de Toulouse > Université Toulouse - Jean Jaurès - UT2J (FRANCE) Université de Toulouse > Université Toulouse 1 Capitole - UT1 (FRANCE) |
Laboratory name: | |
Statistics: | download |
Deposited On: | 11 May 2017 08:30 |
Repository Staff Only: item control page