Leonard S. Pleiss, James Harrison, Maximilian Schiffer

Target-Aligned Reinforcement Learning

Leonard S. Pleiss, James Harrison, Maximilian Schiffer / April 1, 2026

arXiv:2603.29501v1 Announce Type: new
Abstract: Many reinforcement learning algorithms rely on target networks – lagged copies of the online network – to stabilize training. While effective, this mechanism introduces a fundamental stability-recency tr…

Author name: Leonard S. Pleiss, James Harrison, Maximilian Schiffer

Target-Aligned Reinforcement Learning