Xinyu Wang, Changzhi Sun, Yuanbin Wu, Xiaoling Wang

Stabilizing LLM Supervised Fine-Tuning via Explicit Distributional Control

Xinyu Wang, Changzhi Sun, Yuanbin Wu, Xiaoling Wang / May 7, 2026

arXiv:2605.04468v1 Announce Type: new
Abstract: Post-training large language models (LLMs) often suffers from catastrophic forgetting, where improvements on a target objective degrade previously acquired capabilities. Recent evidence suggests that thi…

Author name: Xinyu Wang, Changzhi Sun, Yuanbin Wu, Xiaoling Wang

Stabilizing LLM Supervised Fine-Tuning via Explicit Distributional Control