David Leeftink, Max Hinne, Marcel van Gerven

Neural Co-state Policies: Structuring Hidden States in Recurrent Reinforcement Learning

David Leeftink, Max Hinne, Marcel van Gerven / May 8, 2026

arXiv:2605.05373v1 Announce Type: new
Abstract: A key capability of intelligent agents is operating under partial observability: reasoning and acting effectively despite missing or incomplete state observations. While recurrent (memory-based) policies…

Author name: David Leeftink, Max Hinne, Marcel van Gerven

Neural Co-state Policies: Structuring Hidden States in Recurrent Reinforcement Learning