Zihang Fu, Haonan Wang, Jian Kang, Kenji Kawaguchi, Jiaying Wu

Reasoning Resides in Layers: Restoring Temporal Reasoning in Video-Language Models with Layer-Selective Merging

Zihang Fu, Haonan Wang, Jian Kang, Kenji Kawaguchi, Jiaying Wu / April 14, 2026

arXiv:2604.11399v1 Announce Type: cross
Abstract: Multimodal adaptation equips large language models (LLMs) with perceptual capabilities, but often weakens the reasoning ability inherited from language-only pretraining. This trade-off is especially pr…

Author name: Zihang Fu, Haonan Wang, Jian Kang, Kenji Kawaguchi, Jiaying Wu

Reasoning Resides in Layers: Restoring Temporal Reasoning in Video-Language Models with Layer-Selective Merging