Author name: Weile Gong, Yiping Zuo, Zijian Lu, Xin He, Weibei Fan, Lianyong Qi, Shi Jin

From Plausibility to Verifiability: Risk-Controlled Generative OCR with Vision-Language Models

Weile Gong, Yiping Zuo, Zijian Lu, Xin He, Weibei Fan, Lianyong Qi, Shi Jin / April 16, 2026

arXiv:2603.19790v3 Announce Type: replace
Abstract: Modern vision-language models (VLMs) can act as generative OCR engines, yet open-ended decoding can expose rare but consequential failures. We identify a core deployment misalignment in generative OC…

cs.CV

From Plausibility to Verifiability: Risk-Controlled Generative OCR for Vision-Language Models

Weile Gong, Yiping Zuo, Zijian Lu, Xin He, Weibei Fan, Lianyong Qi, Shi Jin / April 1, 2026

arXiv:2603.19790v2 Announce Type: replace
Abstract: Modern vision-language models (VLMs) can act as generative OCR engines, yet open-ended decoding can expose rare but consequential failures. We identify a core deployment misalignment in generative OC…