Xia Yang, Xuanyi Zhang, Hao Hu, Feng Ji

Beyond Accuracy: Evaluating Strategy Diversity in LLM Mathematical Reasoning

Xia Yang, Xuanyi Zhang, Hao Hu, Feng Ji / May 12, 2026

arXiv:2605.09292v1 Announce Type: new
Abstract: Large language models now achieve high final-answer accuracy on mathematical reasoning benchmarks, but accuracy alone does not capture reasoning flexibility. We introduce a strategy-level evaluation fram…

Author name: Xia Yang, Xuanyi Zhang, Hao Hu, Feng Ji

Beyond Accuracy: Evaluating Strategy Diversity in LLM Mathematical Reasoning