Yeping Jin, Jiaming Hu, Ioannis Ch. Paschalidis

Distributionally Robust Token Optimization in RLHF

Yeping Jin, Jiaming Hu, Ioannis Ch. Paschalidis / April 13, 2026

arXiv:2604.08577v1 Announce Type: new
Abstract: Large Language Models (LLMs) tend to respond correctly to prompts that align to the data they were trained and fine-tuned on. Yet, small shifts in wording, format, or language can trigger surprisingly la…

Author name: Yeping Jin, Jiaming Hu, Ioannis Ch. Paschalidis

Distributionally Robust Token Optimization in RLHF