Meizhu Liu, Yassi Abbasi, Matthew Rowe, Michael Avendi, Paul Li

Lightweight and Production-Ready PDF Visual Element Parsing

Meizhu Liu, Yassi Abbasi, Matthew Rowe, Michael Avendi, Paul Li / April 28, 2026

arXiv:2604.23276v1 Announce Type: cross
Abstract: PDF documents contain critical visual elements such as figures, tables, and forms whose accurate extraction is essential for document understanding and multimodal retrieval-augmented generation (RAG). …

Author name: Meizhu Liu, Yassi Abbasi, Matthew Rowe, Michael Avendi, Paul Li

Lightweight and Production-Ready PDF Visual Element Parsing