Keyu He, Tejas Srinivasan, Brihi Joshi, Xiang Ren, Jesse Thomason, Swabha Swayamdipta

Believing without Seeing: Quality Scores for Contextualizing Vision-Language Model Explanations

Keyu He, Tejas Srinivasan, Brihi Joshi, Xiang Ren, Jesse Thomason, Swabha Swayamdipta / April 23, 2026

arXiv:2509.25844v3 Announce Type: replace
Abstract: When people query Vision-Language Models (VLMs) but cannot see the accompanying visual context (e.g. for blind and low-vision users), augmenting VLM predictions with natural language explanations can…

Author name: Keyu He, Tejas Srinivasan, Brihi Joshi, Xiang Ren, Jesse Thomason, Swabha Swayamdipta

Believing without Seeing: Quality Scores for Contextualizing Vision-Language Model Explanations