Zhiheng Wu, Tong Wang, Shuning Wang, Naiming Liu, Yumeng Zhang

See Further, Think Deeper: Advancing VLM’s Reasoning Ability with Low-level Visual Cues and Reflection

Zhiheng Wu, Tong Wang, Shuning Wang, Naiming Liu, Yumeng Zhang / April 28, 2026

arXiv:2604.24339v1 Announce Type: cross
Abstract: Recent advances in Vision-Language Models (VLMs) have benefited from Reinforcement Learning (RL) for enhanced reasoning. However, existing methods still face critical limitations, including the lack of…

Author name: Zhiheng Wu, Tong Wang, Shuning Wang, Naiming Liu, Yumeng Zhang

See Further, Think Deeper: Advancing VLM’s Reasoning Ability with Low-level Visual Cues and Reflection