Cristian Morasso, Anisa Halimi, Muhammad Zaid Hameed, Douglas Leith

Persona-Conditioned Adversarial Prompting: Multi-Identity Red-Teaming for Adversarial Discovery and Mitigation

Cristian Morasso, Anisa Halimi, Muhammad Zaid Hameed, Douglas Leith / May 13, 2026

arXiv:2605.11730v1 Announce Type: new
Abstract: Automated red-teaming for LLMs often discovers narrow attack slices, missing diverse real-world threats, and yielding insufficient data for safety fine-tuning. We introduce Persona-Conditioned Adversaria…

Author name: Cristian Morasso, Anisa Halimi, Muhammad Zaid Hameed, Douglas Leith

Persona-Conditioned Adversarial Prompting: Multi-Identity Red-Teaming for Adversarial Discovery and Mitigation