Chuou Xu, Liya Ji, Qifeng Chen

Multi-modal Reasoning with LLMs for Visual Semantic Arithmetic

Chuou Xu, Liya Ji, Qifeng Chen / April 22, 2026

arXiv:2604.19567v1 Announce Type: new
Abstract: Reinforcement learning (RL) as post-training is crucial for enhancing the reasoning ability of large language models (LLMs) in coding and math. However, their capacity for visual semantic arithmetic, inf…

Author name: Chuou Xu, Liya Ji, Qifeng Chen

Multi-modal Reasoning with LLMs for Visual Semantic Arithmetic