Arian Eamaz, Farhang Yeganegi, Mojtaba Soltanalian

Trust, but Verify: Peeling Low-Bit Transformer Networks for Training Monitoring

Arian Eamaz, Farhang Yeganegi, Mojtaba Soltanalian / May 5, 2026

arXiv:2605.02853v1 Announce Type: new
Abstract: Understanding whether deep neural networks are effectively optimized remains challenging, as training occurs in highly nonconvex landscapes and standard metrics provide limited visibility into layer-wise…

Author name: Arian Eamaz, Farhang Yeganegi, Mojtaba Soltanalian

Trust, but Verify: Peeling Low-Bit Transformer Networks for Training Monitoring