Sukesh Subaharan - Provide.ai

Dynamical Priors as a Training Objective in Reinforcement Learning

Sukesh Subaharan / April 24, 2026

arXiv:2604.21464v1 Announce Type: cross
Abstract: Standard reinforcement learning (RL) optimizes policies for reward but imposes few constraints on how decisions evolve over time. As a result, policies may achieve high performance while exhibiting tem…

Author name: Sukesh Subaharan

Dynamical Priors as a Training Objective in Reinforcement Learning