Hui Huang, Xuanxin Wu, Muyun Yang, Yuki Arase

Reasoning Model Is Superior LLM-Judge, Yet Suffers from Biases

Hui Huang, Xuanxin Wu, Muyun Yang, Yuki Arase / May 15, 2026

arXiv:2601.03630v2 Announce Type: replace
Abstract: This paper presents the first systematic comparison investigating whether Large Reasoning Models (LRMs) are superior judges to non-reasoning LLMs. Our empirical analysis yields four key findings: 1) …

Author name: Hui Huang, Xuanxin Wu, Muyun Yang, Yuki Arase

Reasoning Model Is Superior LLM-Judge, Yet Suffers from Biases