Zeynel A. Ulu\c{s}an, Burak S. Akbudak, Can S. Erer, G\"ozde G\"ul \c{S}ahin

FormalRewardBench: A Benchmark for Formal Theorem Proving Reward Models

Zeynel A. Ulu\c{s}an, Burak S. Akbudak, Can S. Erer, G\"ozde G\"ul \c{S}ahin / May 12, 2026

arXiv:2605.10141v1 Announce Type: new
Abstract: Recent neural theorem provers use reinforcement learning with verifiable rewards (RLVR), where proof assistants provide binary correctness signals. While verifiable rewards are cheap and scalable without…

Author name: Zeynel A. Ulu\c{s}an, Burak S. Akbudak, Can S. Erer, G\"ozde G\"ul \c{S}ahin

FormalRewardBench: A Benchmark for Formal Theorem Proving Reward Models