Minh Khoa Le, Kien Do, Duc Thanh Nguyen, Truyen Tran

FrameDiT: Diffusion Transformer with Matrix Attention for Efficient Video Generation

Minh Khoa Le, Kien Do, Duc Thanh Nguyen, Truyen Tran / April 21, 2026

arXiv:2603.09721v2 Announce Type: replace
Abstract: High-fidelity video generation remains challenging for diffusion models due to the difficulty of modeling complex spatio-temporal dynamics efficiently. Recent video diffusion methods typically repres…

Author name: Minh Khoa Le, Kien Do, Duc Thanh Nguyen, Truyen Tran

FrameDiT: Diffusion Transformer with Matrix Attention for Efficient Video Generation