Andrew Bond, Ilkin Umut Melanlioglu, Erkut Erdem, Aykut Erdem

Beyond Gaussian Bottlenecks: Topologically Aligned Encoding of Vision-Transformer Feature Spaces

Andrew Bond, Ilkin Umut Melanlioglu, Erkut Erdem, Aykut Erdem / May 1, 2026

arXiv:2604.28122v1 Announce Type: cross
Abstract: Modern visual world modeling systems increasingly rely on high-capacity architectures and large-scale data to produce plausible motion, yet they often fail to preserve underlying 3D geometry or physica…

Author name: Andrew Bond, Ilkin Umut Melanlioglu, Erkut Erdem, Aykut Erdem

Beyond Gaussian Bottlenecks: Topologically Aligned Encoding of Vision-Transformer Feature Spaces