OATAO - Open Archive Toulouse Archive Ouverte Open Access Week

Processus décisionnels de Markov possibilités à observabilité mixte

Drougard, Nicolas and Teichteil-Konigsbuch, Florent and Farges, Jean-Loup and Dubois, Didier Processus décisionnels de Markov possibilités à observabilité mixte. (2015) Revue d'Intelligence Artificielle, 29 (6). 629-653. ISSN 0992-499X

[img]
Preview
(Document in English)

PDF (Author's version) - Requires a PDF viewer such as GSview, Xpdf or Adobe Acrobat Reader
436kB

Official URL: http://dx.doi.org/10.3166/RIA.29.629-653

Abstract

Les processus décisionnels de Markov partiellement observables possibilistes qualita- tifs (π-PDMPO) constituent une alternative aux PDMPO classiques (probabilistes) : ils sont utilisés dans les situations où l’état de croyance initial de l’agent et les probabilités définissant le problème sont imprécises du fait d’un manque de connaissance ou de données. Cependant, tout comme les PDMPO, le calcul d’une stratégie optimale demande un grand nombre d’opé- rations : le nombre d’états de croyance grandit exponentiellement avec le nombre d’états du système. Dans cet article, une version possibiliste des processus décisisionnels de Markov à observabilité mixte est présentée pour simplifier ce calcul : la complexité de résolution d’un π-PDMPO, dont certaines variables d’état sont complètement observables, peut être consi- dérablement réduite. Un algorithme d’itération sur les revenus optimaux pour cette nouvelle formulation est ensuite proposé pour le cas de l’horizon infini, et l’optimalité de la stratégie calculée pour un critère donné est démontrée, lorsqu’il existe une action "rester" dans certains états buts. Les expérimentations montrent finalement que ce modèle possibiliste est plus perfor- mant que le modèle PDMPO probabiliste, utilisé classiquement en robotique, pour un problème de reconnaissance de cible, dans certaines situations où les capacités d’observation de l’agent ne sont pas précises.

Item Type:Article
Additional Information:Thanks to Lavoisier editor. This papers appears in volume 29 of Revue d'Intelligence Artificielle ISSN 0992-499X The original PDF is available at: http://ria.revuesonline.com/article.jsp?articleId=35834
HAL Id:hal-01530407
Audience (journal):International peer-reviewed journal
Uncontrolled Keywords:
Institution:French research institutions > Centre National de la Recherche Scientifique - CNRS (FRANCE)
Université de Toulouse > Institut National Polytechnique de Toulouse - INPT (FRANCE)
French research institutions > Office National d'Etudes et Recherches Aérospatiales - ONERA (FRANCE)
Université de Toulouse > Université Toulouse III - Paul Sabatier - UPS (FRANCE)
Université de Toulouse > Université Toulouse - Jean Jaurès - UT2J (FRANCE)
Université de Toulouse > Université Toulouse 1 Capitole - UT1 (FRANCE)
Laboratory name:
Statistics:download
Deposited By: IRIT IRIT
Deposited On:11 May 2017 08:30

Repository Staff Only: item control page