Dinghong Song, Jierui Xu, Weichu Yang, Pengfei Su, Dong Li

NeuronMLP: Efficient LLM Inference via Singular Value Decomposition Compression and Tiling on AWS Trainium

Dinghong Song, Jierui Xu, Weichu Yang, Pengfei Su, Dong Li / April 27, 2026

arXiv:2510.25977v4 Announce Type: replace
Abstract: Emerging AI accelerators have started to gain attention and offer new opportunities for efficient inference of large language models (LLMs). Trainium, an AI accelerator recently developed by Amazon W…

Author name: Dinghong Song, Jierui Xu, Weichu Yang, Pengfei Su, Dong Li

NeuronMLP: Efficient LLM Inference via Singular Value Decomposition Compression and Tiling on AWS Trainium