Md Jueal Mia, Joaquin Molto, Yanzhao Wu, M. Hadi Amini

GUARD-SLM: Token Activation-Based Defense Against Jailbreak Attacks for Small Language Models

Md Jueal Mia, Joaquin Molto, Yanzhao Wu, M. Hadi Amini / April 1, 2026

arXiv:2603.28817v1 Announce Type: cross
Abstract: Small Language Models (SLMs) are emerging as efficient and economically viable alternatives to Large Language Models (LLMs), offering competitive performance with significantly lower computational cost…

Author name: Md Jueal Mia, Joaquin Molto, Yanzhao Wu, M. Hadi Amini

GUARD-SLM: Token Activation-Based Defense Against Jailbreak Attacks for Small Language Models