Kris De Asis, Mohamed Elsayed, Jiamin He

Extending Differential Temporal Difference Methods for Episodic Problems

Kris De Asis, Mohamed Elsayed, Jiamin He / May 7, 2026

arXiv:2605.04368v1 Announce Type: new
Abstract: Differential temporal difference (TD) methods are value-based reinforcement learning algorithms that have been proposed for infinite-horizon problems. They rely on reward centering, where each reward is …

Author name: Kris De Asis, Mohamed Elsayed, Jiamin He

Extending Differential Temporal Difference Methods for Episodic Problems