Xingcheng Zhou, Mingyu Liu, Walter Zimmer, Jiajie Zhang, Alois Knoll

SGTA: Scene-Graph Based Multi-Modal Traffic Agent for Video Understanding

Xingcheng Zhou, Mingyu Liu, Walter Zimmer, Jiajie Zhang, Alois Knoll / April 7, 2026

arXiv:2604.03697v1 Announce Type: new
Abstract: We present Scene-Graph Based Multi-Modal Traffic Agent (SGTA), a modular framework for traffic video understanding that combines structured scene graphs with multi-modal reasoning. It constructs a traffi…

Author name: Xingcheng Zhou, Mingyu Liu, Walter Zimmer, Jiajie Zhang, Alois Knoll

SGTA: Scene-Graph Based Multi-Modal Traffic Agent for Video Understanding