Hongyaoxing Gu, Xinzhe Chen, Lijuan Hu, Fangfang Liu

TileQ: Efficient Low-Rank Quantization of Mixture-of-Experts with 2D Tiling

Hongyaoxing Gu, Xinzhe Chen, Lijuan Hu, Fangfang Liu / May 12, 2026

arXiv:2605.09281v1 Announce Type: new
Abstract: Mixture-of-Experts (MoE) models achieve remarkable performance by sparsely activating specialized experts, yet their massive parameters in experts pose significant challenges for deployment. While low-ra…

Author name: Hongyaoxing Gu, Xinzhe Chen, Lijuan Hu, Fangfang Liu

TileQ: Efficient Low-Rank Quantization of Mixture-of-Experts with 2D Tiling