Author name: Chenchen Zhang

From Reasoning to Agentic: Credit Assignment in Reinforcement Learning for Large Language Models

Chenchen Zhang / April 14, 2026

arXiv:2604.09459v2 Announce Type: replace
Abstract: Reinforcement learning (RL) for large language models (LLMs) increasingly relies on sparse, outcome-level rewards — yet determining which actions within a long trajectory caused the outcome remains …

cs.CL

From Reasoning to Agentic: Credit Assignment in Reinforcement Learning for Large Language Models

Chenchen Zhang / April 13, 2026

arXiv:2604.09459v1 Announce Type: new
Abstract: Reinforcement learning (RL) for large language models (LLMs) increasingly relies on sparse, outcome-level rewards — yet determining which actions within a long trajectory caused the outcome remains diff…