Marek Petrik – Optimization Online

Robust Phi-Divergence MDPs

Published: 2022/05/27, Updated: 2023/01/12

In recent years, robust Markov decision processes (MDPs) have emerged as a prominent modeling framework for dynamic decision problems affected by uncertainty. In contrast to classical MDPs, which only account for stochasticity by modeling the dynamics through a stochastic process with a known transition kernel, robust MDPs additionally account for ambiguity by optimizing in view … Read more

Partial Policy Iteration for L1-Robust Markov Decision Processes

Published: 2020/06/18

Chin Pang Ho

Marek Petrik

Wolfram Wiesemann

Robust Optimization markov decision processes, robust optimization

Robust Markov decision processes (MDPs) allow to compute reliable solutions for dynamic decision problems whose evolution is modeled by rewards and partially-known transition probabilities. Unfortunately, accounting for uncertainty in the transition probabilities significantly increases the computational complexity of solving robust MDPs, which severely limits their scalability. This paper describes new efficient algorithms for solving the … Read more