Kepeng Xu, Li Xu, Gang He, Wenxin Yu

Allegory of the Cave: Measurement-Grounded Vision-Language Learning

Kepeng Xu, Li Xu, Gang He, Wenxin Yu / May 13, 2026

arXiv:2605.11727v1 Announce Type: cross
Abstract: Vision-language models typically reason over post-ISP RGB images, although RGB rendering can clip, suppress, or quantize sensor evidence before inference. We study whether grounding improves when the v…

Author name: Kepeng Xu, Li Xu, Gang He, Wenxin Yu

Allegory of the Cave: Measurement-Grounded Vision-Language Learning