Mingqian Zheng, Malia Morgan, Liwei Jiang, Carolyn Rose, Maarten Sap

Useless but Safe? Benchmarking Utility Recovery with User Intent Clarification in Multi-Turn Conversations

Mingqian Zheng, Malia Morgan, Liwei Jiang, Carolyn Rose, Maarten Sap / May 1, 2026

arXiv:2604.27093v1 Announce Type: cross
Abstract: Current LLM safety alignment techniques improve model robustness against adversarial attacks, but overlook whether and how LLMs can recover helpfulness when benign users clarify their intent. We introd…

Author name: Mingqian Zheng, Malia Morgan, Liwei Jiang, Carolyn Rose, Maarten Sap

Useless but Safe? Benchmarking Utility Recovery with User Intent Clarification in Multi-Turn Conversations