Gautam Kumar Jain, Carsten Markgraf, Julian St\"ahler

Cross-Stage Coherence in Hierarchical Driving VQA: Explicit Baselines and Learned Gated Context Projectors

Gautam Kumar Jain, Carsten Markgraf, Julian St\"ahler / April 27, 2026

arXiv:2604.22560v1 Announce Type: cross
Abstract: Graph Visual Question Answering (GVQA) for autonomous driving organizes reasoning into ordered stages, namely Perception, Prediction, and Planning, where planning decisions should remain consistent wit…

Author name: Gautam Kumar Jain, Carsten Markgraf, Julian St\"ahler

Cross-Stage Coherence in Hierarchical Driving VQA: Explicit Baselines and Learned Gated Context Projectors