Nan Wang, Zhiwei Jin, Chen Chen, Haonan Lu

PixelPrune: Pixel-Level Adaptive Visual Token Reduction via Predictive Coding

Nan Wang, Zhiwei Jin, Chen Chen, Haonan Lu / April 2, 2026

arXiv:2604.00886v1 Announce Type: cross
Abstract: Document understanding and GUI interaction are among the highest-value applications of Vision-Language Models (VLMs), yet they impose exceptionally heavy computational burden: fine-grained text and sma…

Author name: Nan Wang, Zhiwei Jin, Chen Chen, Haonan Lu

PixelPrune: Pixel-Level Adaptive Visual Token Reduction via Predictive Coding