Wang Bill Zhu, Qiutong Tony Yi, Robin Jia, Jesse Thomason

PDDL-Mind: Large Language Models are Capable on Belief Reasoning with Reliable State Tracking

Wang Bill Zhu, Qiutong Tony Yi, Robin Jia, Jesse Thomason / April 21, 2026

arXiv:2604.17819v1 Announce Type: new
Abstract: Large language models (LLMs) perform substantially below human level on existing theory-of-mind (ToM) benchmarks, even when augmented with chain-of-thought prompting or probabilistic belief updates. We a…

Author name: Wang Bill Zhu, Qiutong Tony Yi, Robin Jia, Jesse Thomason

PDDL-Mind: Large Language Models are Capable on Belief Reasoning with Reliable State Tracking