Yuxuan Jiang, Francis Ferraro

SCRIBE: Structured Mid-Level Supervision for Tool-Using Language Models

Yuxuan Jiang, Francis Ferraro / April 28, 2026

arXiv:2601.03555v2 Announce Type: replace
Abstract: Training reliable tool-augmented agents remains a significant challenge, largely due to the difficulty of credit assignment in multi-step reasoning. While process-level reward models offer a promisin…

Author name: Yuxuan Jiang, Francis Ferraro

SCRIBE: Structured Mid-Level Supervision for Tool-Using Language Models