Chaoran Chen, Dayu Yuan, Peter Kairouz

Behavioral Canaries: Auditing Private Retrieved Context Usage in RL Fine-Tuning

Chaoran Chen, Dayu Yuan, Peter Kairouz / April 27, 2026

arXiv:2604.22191v1 Announce Type: cross
Abstract: In agentic workflows, LLMs frequently process retrieved contexts that are legally protected from further training. However, auditors currently lack a reliable way to verify if a provider has violated t…

Author name: Chaoran Chen, Dayu Yuan, Peter Kairouz

Behavioral Canaries: Auditing Private Retrieved Context Usage in RL Fine-Tuning