Kadir Yilmaz, Adrian Kruse, Tristan H\"ofer, Daan de Geus, Bastian Leibe

Volume Transformer: Revisiting Vanilla Transformers for 3D Scene Understanding

Kadir Yilmaz, Adrian Kruse, Tristan H\"ofer, Daan de Geus, Bastian Leibe / April 22, 2026

arXiv:2604.19609v1 Announce Type: new
Abstract: Transformers have become a common foundation across deep learning, yet 3D scene understanding still relies on specialized backbones with strong domain priors. This keeps the field isolated from the broad…

Author name: Kadir Yilmaz, Adrian Kruse, Tristan H\"ofer, Daan de Geus, Bastian Leibe

Volume Transformer: Revisiting Vanilla Transformers for 3D Scene Understanding