Yao Du, Shanshan Li, Xiaomeng Li

Injecting Distributional Awareness into MLLMs via Reinforcement Learning for Deep Imbalanced Regression

Yao Du, Shanshan Li, Xiaomeng Li / May 5, 2026

arXiv:2605.01402v1 Announce Type: new
Abstract: Multimodal large language models (MLLMs) struggle with numerical regression under long-tailed target distributions. Token-level supervised fine-tuning (SFT) and point-wise regression rewards bias learnin…

Author name: Yao Du, Shanshan Li, Xiaomeng Li

Injecting Distributional Awareness into MLLMs via Reinforcement Learning for Deep Imbalanced Regression