Mingtao Xian, Yifeng Yang, Qinying Gu, Xinbing Wang, Nanyang Ye

Logit-Attention Divergence: Mitigating Position Bias in Multi-Image Retrieval via Attention-Guided Calibration

Mingtao Xian, Yifeng Yang, Qinying Gu, Xinbing Wang, Nanyang Ye / May 13, 2026

arXiv:2605.11591v1 Announce Type: new
Abstract: Multimodal Large Language Models (MLLMs) have shown strong performance in multi-image cross-modal retrieval, yet suffer from severe position bias, where predictions are dominated by input order rather th…

Author name: Mingtao Xian, Yifeng Yang, Qinying Gu, Xinbing Wang, Nanyang Ye

Logit-Attention Divergence: Mitigating Position Bias in Multi-Image Retrieval via Attention-Guided Calibration