Rikuto Kotoge, Mai Nishimura, Jiaxin Ma

Can Compact Language Models Search Like Agents? Distillation-Guided Policy Optimization for Preserving Agentic RAG Capabilities

Rikuto Kotoge, Mai Nishimura, Jiaxin Ma / April 28, 2026

arXiv:2508.20324v4 Announce Type: replace
Abstract: Reinforcement Learning has emerged as a dominant post-training approach to elicit agentic RAG behaviors such as search and planning from language models. Despite its success with larger models, apply…

Author name: Rikuto Kotoge, Mai Nishimura, Jiaxin Ma

Can Compact Language Models Search Like Agents? Distillation-Guided Policy Optimization for Preserving Agentic RAG Capabilities