Xiaoyi Dong, Xi Sheryl Zhang, Jian Cheng

Mean Flow Policy Optimization

Xiaoyi Dong, Xi Sheryl Zhang, Jian Cheng / April 17, 2026

arXiv:2604.14698v1 Announce Type: new
Abstract: Diffusion models have recently emerged as expressive policy representations for online reinforcement learning (RL). However, their iterative generative processes introduce substantial training and infere…

Author name: Xiaoyi Dong, Xi Sheryl Zhang, Jian Cheng

Mean Flow Policy Optimization