Jiayi Liu, Jiaxing Zhang, Bowen Jin, Jennifer Neville

Generating Leakage-Free Benchmarks for Robust RAG Evaluation

Jiayi Liu, Jiaxing Zhang, Bowen Jin, Jennifer Neville / May 12, 2026

arXiv:2605.08838v1 Announce Type: cross
Abstract: Retrieval-augmented generation (RAG) is widely used to augment large language models (LLMs) with external knowledge. However, many benchmark datasets, designed to test RAG performance, comprise many qu…

Author name: Jiayi Liu, Jiaxing Zhang, Bowen Jin, Jennifer Neville

Generating Leakage-Free Benchmarks for Robust RAG Evaluation