Erel Shtossel, Alicia Vidler, Uri Shaham, Gal A. Kaminka

A Harmonic Mean Formulation of Average Reward Reinforcement Learning in SMDPs

Erel Shtossel, Alicia Vidler, Uri Shaham, Gal A. Kaminka / May 7, 2026

arXiv:2605.04880v1 Announce Type: new
Abstract: Recent research has revived and amplified interest in algorithms for undiscounted average reward reinforcement learning in infinite-horizon, non-episodic (continuing) tasks. Semi-Markov decision processe…

Author name: Erel Shtossel, Alicia Vidler, Uri Shaham, Gal A. Kaminka

A Harmonic Mean Formulation of Average Reward Reinforcement Learning in SMDPs