Quy-Anh Dang, Chris Ngo, Truong-Son Hy

RedBench: A Universal Dataset for Comprehensive Red Teaming of Large Language Models

Quy-Anh Dang, Chris Ngo, Truong-Son Hy / April 20, 2026

arXiv:2601.03699v2 Announce Type: replace
Abstract: As large language models (LLMs) become integral to safety-critical applications, ensuring their robustness against adversarial prompts is paramount. However, existing red teaming datasets suffer from…

Author name: Quy-Anh Dang, Chris Ngo, Truong-Son Hy

RedBench: A Universal Dataset for Comprehensive Red Teaming of Large Language Models