Guy Azov, Ofer Rivlin, Guy Shtar

SALLIE: Safeguarding Against Latent Language & Image Exploits

Guy Azov, Ofer Rivlin, Guy Shtar / April 9, 2026

arXiv:2604.06247v1 Announce Type: cross
Abstract: Large Language Models (LLMs) and Vision-Language Models (VLMs) remain highly vulnerable to textual and visual jailbreaks, as well as prompt injections (arXiv:2307.15043, Greshake et al., 2023, arXiv:23…

Author name: Guy Azov, Ofer Rivlin, Guy Shtar

SALLIE: Safeguarding Against Latent Language & Image Exploits