Haodong Liang, Lifeng Lai

Transformers Provably Implement In-Context Reinforcement Learning with Policy Improvement

Haodong Liang, Lifeng Lai / May 8, 2026

arXiv:2605.05755v1 Announce Type: new
Abstract: We investigate the ability of transformers to perform in-context reinforcement learning (ICRL), where a model must infer and execute learning algorithms from trajectory data without parameter updates. We…

Author name: Haodong Liang, Lifeng Lai

Transformers Provably Implement In-Context Reinforcement Learning with Policy Improvement