Feiyu Wu, Xu Zheng, Zhuocheng Wang, Yi ming Dai, Hui Li

RHyVE: Competence-Aware Verification and Phase-Aware Deployment for LLM-Generated Reward Hypotheses

Feiyu Wu, Xu Zheng, Zhuocheng Wang, Yi ming Dai, Hui Li / May 1, 2026

arXiv:2604.28056v1 Announce Type: new
Abstract: Large language models (LLMs) make reward design in reinforcement learning substantially more scalable, but generated rewards are not automatically reliable training objectives. Existing work has focused …

Author name: Feiyu Wu, Xu Zheng, Zhuocheng Wang, Yi ming Dai, Hui Li

RHyVE: Competence-Aware Verification and Phase-Aware Deployment for LLM-Generated Reward Hypotheses