Bochao Li, Yao Fu, Wei Chen, Fang Kong

Sample-Mean Anchored Thompson Sampling for Offline-to-Online Learning with Distribution Shift

Bochao Li, Yao Fu, Wei Chen, Fang Kong / May 12, 2026

arXiv:2605.10289v1 Announce Type: cross
Abstract: Offline-to-online learning aims to improve online decision-making by leveraging offline logged data. A central challenge in this setting is the distribution shift between offline and online environment…

Author name: Bochao Li, Yao Fu, Wei Chen, Fang Kong

Sample-Mean Anchored Thompson Sampling for Offline-to-Online Learning with Distribution Shift