Author name: Jingze Wu, Quan Zhang, Hongfei Suo, Zeqiang Cai, Hongbo Chen

Beyond Perceptual Shortcuts: Causal-Inspired Debiasing Optimization for Generalizable Video Reasoning in Lightweight MLLMs

Jingze Wu, Quan Zhang, Hongfei Suo, Zeqiang Cai, Hongbo Chen / May 6, 2026

arXiv:2605.01324v2 Announce Type: replace
Abstract: Although reinforcement learning (RL) has significantly advanced reasoning capabilities in large multimodal language models (MLLMs), its efficacy remains limited for lightweight models essential for e…

cs.CV

Beyond Perceptual Shortcuts: Causal-Inspired Debiasing Optimization for Generalizable Video Reasoning in Lightweight MLLMs

Jingze Wu, Quan Zhang, Hongfei Suo, Zeqiang Cai, Hongbo Chen / May 5, 2026

arXiv:2605.01324v1 Announce Type: new
Abstract: Although reinforcement learning (RL) has significantly advanced reasoning capabilities in large multimodal language models (MLLMs), its efficacy remains limited for lightweight models essential for edge …