Yanda Li, Yuhan Liu, Zirui Song, Yunchao Wei, Martin Tak\'a\v{c}, Salem Lahlou

Temporal Contrastive Decoding: A Training-Free Method for Large Audio-Language Models

Yanda Li, Yuhan Liu, Zirui Song, Yunchao Wei, Martin Tak\'a\v{c}, Salem Lahlou / April 20, 2026

arXiv:2604.15383v1 Announce Type: cross
Abstract: Large audio-language models (LALMs) generalize across speech, sound, and music, but unified decoders can exhibit a \emph{temporal smoothing bias}: transient acoustic cues may be underutilized in favor …

Author name: Yanda Li, Yuhan Liu, Zirui Song, Yunchao Wei, Martin Tak\'a\v{c}, Salem Lahlou

Temporal Contrastive Decoding: A Training-Free Method for Large Audio-Language Models