Rui Li, Ke Hao, Yuanzhi Liang, Haibin Huang, Chi Zhang, Yun Gu, XueLong Li

Learning to Credit the Right Steps: Objective-aware Process Optimization for Visual Generation

Rui Li, Ke Hao, Yuanzhi Liang, Haibin Huang, Chi Zhang, Yun Gu, XueLong Li / April 28, 2026

arXiv:2604.19234v2 Announce Type: replace
Abstract: Reinforcement learning, particularly Group Relative Policy Optimization (GRPO), has emerged as an effective framework for post-training visual generative models with human preference signals. However…

Author name: Rui Li, Ke Hao, Yuanzhi Liang, Haibin Huang, Chi Zhang, Yun Gu, XueLong Li

Learning to Credit the Right Steps: Objective-aware Process Optimization for Visual Generation