Zichen Zou, Xiaosong Jia, Zuxuan Wu, Yu-Gang Jiang

Attention Itself Could Retrieve.RetrieveVGGT: Training-Free Long Context Streaming 3D Reconstruction via Query-Key Similarity Retrieval

Zichen Zou, Xiaosong Jia, Zuxuan Wu, Yu-Gang Jiang / May 12, 2026

arXiv:2605.09644v1 Announce Type: new
Abstract: Visual Geometry Grounded Transformer (VGGT) advances 3D reconstruction via scalable Transformer architecture, but the quadratic complexity of global attention prevents long context application. StreamVGG…

Author name: Zichen Zou, Xiaosong Jia, Zuxuan Wu, Yu-Gang Jiang

Attention Itself Could Retrieve.RetrieveVGGT: Training-Free Long Context Streaming 3D Reconstruction via Query-Key Similarity Retrieval