Jingru Li, Wei Ren, Tianqing Zhu

Seeing No Evil: Blinding Large Vision-Language Models to Safety Instructions via Adversarial Attention Hijacking

Jingru Li, Wei Ren, Tianqing Zhu / April 14, 2026

arXiv:2604.10299v1 Announce Type: cross
Abstract: Large Vision-Language Models (LVLMs) rely on attention-based retrieval of safety instructions to maintain alignment during generation. Existing attacks typically optimize image perturbations to maximiz…

Author name: Jingru Li, Wei Ren, Tianqing Zhu

Seeing No Evil: Blinding Large Vision-Language Models to Safety Instructions via Adversarial Attention Hijacking