Hengyi Feng, Zeang Sheng, Meiyi Qiang, Yang Li, Wentao Zhang

Generative Giants, Retrieval Weaklings: Why do Multimodal Large Language Models Fail at Multimodal Retrieval?

Hengyi Feng, Zeang Sheng, Meiyi Qiang, Yang Li, Wentao Zhang / May 12, 2026

arXiv:2512.19115v2 Announce Type: replace
Abstract: Despite the remarkable success of multimodal large language models (MLLMs) in generative tasks, we observe that they exhibit a counterintuitive deficiency in the zero-shot multimodal retrieval task. …

Author name: Hengyi Feng, Zeang Sheng, Meiyi Qiang, Yang Li, Wentao Zhang

Generative Giants, Retrieval Weaklings: Why do Multimodal Large Language Models Fail at Multimodal Retrieval?