Andrzej Ruszczynski, Tiangang Zhang

Reinforcement Learning with Markov Risk Measures and Multipattern Risk Approximation

Andrzej Ruszczynski, Tiangang Zhang / May 4, 2026

arXiv:2605.00654v1 Announce Type: cross
Abstract: For a risk-averse finite-horizon Markov Decision Problem, we introduce a special class of Markov coherent risk measures, called mini-batch measures. We also define the class of multipattern risk-averse…

Author name: Andrzej Ruszczynski, Tiangang Zhang

Reinforcement Learning with Markov Risk Measures and Multipattern Risk Approximation