Chris Samarinas, Haw-Shiuan Chang, Hamed Zamani

Truncated Step-Level Sampling with Process Rewards for Retrieval-Augmented Reasoning

Chris Samarinas, Haw-Shiuan Chang, Hamed Zamani / April 2, 2026

arXiv:2602.23440v3 Announce Type: replace
Abstract: Reinforcement learning has emerged as an effective paradigm for training large language models to interleave reasoning with search engine calls. However, existing approaches face a fundamental credit…

Author name: Chris Samarinas, Haw-Shiuan Chang, Hamed Zamani

Truncated Step-Level Sampling with Process Rewards for Retrieval-Augmented Reasoning