Mariam Hassan, Bastien Van Delft, Wuyang Li, Alexandre Alahi

Anchored Video Generation: Decoupling Scene Construction and Temporal Synthesis in Text-to-Video Diffusion Models

Mariam Hassan, Bastien Van Delft, Wuyang Li, Alexandre Alahi / March 26, 2026

arXiv:2512.16371v2 Announce Type: replace
Abstract: State-of-the-art Text-to-Video (T2V) diffusion models can generate visually impressive results, yet they still frequently fail to compose complex scenes or follow logical temporal instructions. In th…

Author name: Mariam Hassan, Bastien Van Delft, Wuyang Li, Alexandre Alahi

Anchored Video Generation: Decoupling Scene Construction and Temporal Synthesis in Text-to-Video Diffusion Models