Jie Jiang, Xing Sun, Ruotian Chen, Jianan Su, Kaixin Shen

Performance-Driven Policy Optimization for Speculative Decoding with Adaptive Windowing

Jie Jiang, Xing Sun, Ruotian Chen, Jianan Su, Kaixin Shen / May 18, 2026

arXiv:2605.14978v2 Announce Type: replace
Abstract: Speculative decoding accelerates LLM inference by having a lightweight draft model propose speculative windows of candidate tokens for parallel verification by a larger target model. In practice, spe…

Author name: Jie Jiang, Xing Sun, Ruotian Chen, Jianan Su, Kaixin Shen

Performance-Driven Policy Optimization for Speculative Decoding with Adaptive Windowing