Author name: Xiping Li, Jianghong Ma

AIM-CoT: Active Information-driven Multimodal Chain-of-Thought for Vision-Language Reasoning

Xiping Li, Jianghong Ma / April 21, 2026

arXiv:2509.25699v3 Announce Type: replace
Abstract: Interleaved-Modal Chain-of-Thought (I-MCoT) advances vision-language reasoning, such as Visual Question Answering (VQA). This paradigm integrates specially selected visual evidence from the input ima…

cs.CV

AIM-CoT: Active Information-driven Multimodal Chain-of-Thought for Vision-Language Reasoning

Xiping Li, Jianghong Ma / April 16, 2026

arXiv:2509.25699v2 Announce Type: replace
Abstract: Interleaved-Modal Chain-of-Thought (I-MCoT) advances vision-language reasoning, such as Visual Question Answering (VQA). This paradigm integrates specially selected visual evidence from the input ima…