Mohamad Amin Sharifi Kolarijani – Optimization Online

From Optimization to Control: Quasi Policy Iteration

Published: 2023/11/27, Updated: 2025/08/26

Mohamad Amin Sharifi Kolarijani
Peyman Mohajerin Esfahani

Recent control algorithms for Markov decision processes (MDPs) have been designed using an implicit analogy with well-established optimization algorithms. In this paper, we adopt the quasi-Newton method (QNM) from convex optimization to introduce a novel control algorithm coined as quasi-policy iteration (QPI). In particular, QPI is based on a novel approximation of the “Hessian” matrix … Read more