Younes Javanmard, Tanmoy Pandit, Masoud Mardani

Compressing Transformer Language Models via Matrix Product Operator Decomposition: A Case Study on PicoGPT

Younes Javanmard, Tanmoy Pandit, Masoud Mardani / March 31, 2026

arXiv:2603.28534v1 Announce Type: new
Abstract: Transformer-based language models achieve strong performance across NLP tasks, but their quadratic parameter scaling with hidden dimension makes deployment on resource-constrained hardware expensive. We …

Author name: Younes Javanmard, Tanmoy Pandit, Masoud Mardani

Compressing Transformer Language Models via Matrix Product Operator Decomposition: A Case Study on PicoGPT