Zhiyuan Lu, Chenliang Li, Yingcheng Shi, Weizhou Shen, Ming Yan, Fei Huang

CorpusQA: A 10 Million Token Benchmark for Corpus-Level Analysis and Reasoning

Zhiyuan Lu, Chenliang Li, Yingcheng Shi, Weizhou Shen, Ming Yan, Fei Huang / April 28, 2026

arXiv:2601.14952v2 Announce Type: replace
Abstract: While large language models now handle million-token contexts, their capacity for reasoning across entire document repositories remains largely untested. Existing benchmarks are inadequate, as they a…

Author name: Zhiyuan Lu, Chenliang Li, Yingcheng Shi, Weizhou Shen, Ming Yan, Fei Huang

CorpusQA: A 10 Million Token Benchmark for Corpus-Level Analysis and Reasoning