Faris Chaudhry, Keisuke Yano, Anthea Monod

Feature Starvation as Geometric Instability in Sparse Autoencoders

Faris Chaudhry, Keisuke Yano, Anthea Monod / May 8, 2026

arXiv:2605.05341v1 Announce Type: cross
Abstract: Sparse autoencoders (SAEs) are used to disentangle the dense, polysemantic internal representations of large language models (LLMs) into interpretable, monosemantic concepts. However, standard $\ell_1$…

Author name: Faris Chaudhry, Keisuke Yano, Anthea Monod

Feature Starvation as Geometric Instability in Sparse Autoencoders