Zhehang Du, Hangfeng He, Weijie Su

Uncovering Symmetry Transfer in Large Language Models via Layer-Peeled Optimization

Zhehang Du, Hangfeng He, Weijie Su / May 14, 2026

arXiv:2605.12756v1 Announce Type: cross
Abstract: Large language models (LLMs) are pretrained by minimizing the cross-entropy loss for next-token prediction. In this paper, we study whether this optimization strategy can induce geometric structure in …

Author name: Zhehang Du, Hangfeng He, Weijie Su

Uncovering Symmetry Transfer in Large Language Models via Layer-Peeled Optimization