Yuefei Chen, Vivek K. Singh, Jing Ma, Ruixiang Tang

CounterBench: Evaluating and Improving Counterfactual Reasoning in Large Language Models

Yuefei Chen, Vivek K. Singh, Jing Ma, Ruixiang Tang / April 14, 2026

arXiv:2502.11008v2 Announce Type: replace
Abstract: Counterfactual reasoning is widely recognized as one of the most challenging and intricate aspects of causality in artificial intelligence. In this paper, we evaluate the performance of large languag…

Author name: Yuefei Chen, Vivek K. Singh, Jing Ma, Ruixiang Tang

CounterBench: Evaluating and Improving Counterfactual Reasoning in Large Language Models