Hong-Tao Yu, Yuxin Peng, Serge Belongie, Xiu-Shen Wei

Benchmarking Large Vision-Language Models on Fine-Grained Image Tasks: A Comprehensive Evaluation

Hong-Tao Yu, Yuxin Peng, Serge Belongie, Xiu-Shen Wei / April 14, 2026

arXiv:2504.14988v3 Announce Type: replace
Abstract: Recent advancements in Large Vision-Language Models (LVLMs) have demonstrated remarkable multimodal perception capabilities, garnering significant attention. While numerous evaluation studies have em…

Author name: Hong-Tao Yu, Yuxin Peng, Serge Belongie, Xiu-Shen Wei

Benchmarking Large Vision-Language Models on Fine-Grained Image Tasks: A Comprehensive Evaluation