Zongfang Liu, Shengkun Tang, Yifan Shen, Huan Wang, Xin Yuan

AIMER: Calibration-Free Task-Agnostic MoE Pruning

Zongfang Liu, Shengkun Tang, Yifan Shen, Huan Wang, Xin Yuan / April 14, 2026

arXiv:2603.18492v2 Announce Type: replace
Abstract: Mixture-of-Experts (MoE) language models increase parameter capacity without proportional per-token compute, but the deployment still requires storing all experts, making expert pruning important for…

Author name: Zongfang Liu, Shengkun Tang, Yifan Shen, Huan Wang, Xin Yuan

AIMER: Calibration-Free Task-Agnostic MoE Pruning