Jongyoon Kim, Hojae Han, Seung-won Hwang

Benchmarking Testing in Automated Theorem Proving

Jongyoon Kim, Hojae Han, Seung-won Hwang / April 28, 2026

arXiv:2604.23698v1 Announce Type: new
Abstract: Recent advances in large language models (LLMs) have shown promise in formal theorem proving, yet evaluating semantic correctness remains challenging. Existing evaluations rely on indirect proxies such a…

Author name: Jongyoon Kim, Hojae Han, Seung-won Hwang

Benchmarking Testing in Automated Theorem Proving