Joshua Rozner, Cory Shain

Perturbation: A simple and efficient adversarial tracer for representation learning in language models

Joshua Rozner, Cory Shain / March 26, 2026

arXiv:2603.23821v1 Announce Type: cross
Abstract: Linguistic representation learning in deep neural language models (LMs) has been studied for decades, for both practical and theoretical reasons. However, finding representations in LMs remains an unso…

Author name: Joshua Rozner, Cory Shain

Perturbation: A simple and efficient adversarial tracer for representation learning in language models