Jiarui Guan, Wenshuai Zhao, Zhengtao Zou, Juho Kannala, Arno Solin

Latent-Compressed Variational Autoencoder for Video Diffusion Models

Jiarui Guan, Wenshuai Zhao, Zhengtao Zou, Juho Kannala, Arno Solin / April 21, 2026

arXiv:2604.16479v1 Announce Type: new
Abstract: Video variational autoencoders (VAEs) used in latent diffusion models typically require a sufficiently large number of latent channels to ensure high-quality video reconstruction. However, recent studies…

Author name: Jiarui Guan, Wenshuai Zhao, Zhengtao Zou, Juho Kannala, Arno Solin

Latent-Compressed Variational Autoencoder for Video Diffusion Models