Zhuohao Chen, Zeng Li, Yifei Zhang, Chang Liu, Yu Zhou

Masked Next-Scale Prediction for Self-supervised Scene Text Recognition

Zhuohao Chen, Zeng Li, Yifei Zhang, Chang Liu, Yu Zhou / May 15, 2026

arXiv:2605.14885v1 Announce Type: new
Abstract: Scene Text Recognition requires modeling visual structures that evolve from coarse layouts to fine-grained character strokes. Training such models relies on large amounts of annotated data. Recent self-s…

Author name: Zhuohao Chen, Zeng Li, Yifei Zhang, Chang Liu, Yu Zhou

Masked Next-Scale Prediction for Self-supervised Scene Text Recognition