Zizhao Chen, Ping Wei, Ziyang Ren, Huan Li, Xiangru Yin

Bridging Pixels and Words: Mask-Aware Local Semantic Fusion for Multimodal Media Verification

Zizhao Chen, Ping Wei, Ziyang Ren, Huan Li, Xiangru Yin / March 30, 2026

arXiv:2603.26052v1 Announce Type: new
Abstract: As multimodal misinformation becomes more sophisticated, its detection and grounding are crucial. However, current multimodal verification methods, relying on passive holistic fusion, struggle with sophi…

Author name: Zizhao Chen, Ping Wei, Ziyang Ren, Huan Li, Xiangru Yin

Bridging Pixels and Words: Mask-Aware Local Semantic Fusion for Multimodal Media Verification