Vin Bhaskara, Haicheng Wang

Curiosity-Critic: Cumulative Prediction Error Improvement as a Tractable Intrinsic Reward for World Model Training

Vin Bhaskara, Haicheng Wang / April 22, 2026

arXiv:2604.18701v1 Announce Type: new
Abstract: Local prediction-error-based curiosity rewards focus on the current transition without considering the world model’s cumulative prediction error across all visited transitions. We introduce Curiosity-Cri…

Author name: Vin Bhaskara, Haicheng Wang

Curiosity-Critic: Cumulative Prediction Error Improvement as a Tractable Intrinsic Reward for World Model Training