Zhuofan Wen, Yang Feng

SpecBound: Adaptive Bounded Self-Speculation with Layer-wise Confidence Calibration

Zhuofan Wen, Yang Feng / April 15, 2026

arXiv:2604.12247v1 Announce Type: cross
Abstract: Speculative decoding has emerged as a promising approach to accelerate autoregressive inference in large language models (LLMs). Self-draft methods, which leverage the base LLM itself for speculation, …

Author name: Zhuofan Wen, Yang Feng

SpecBound: Adaptive Bounded Self-Speculation with Layer-wise Confidence Calibration