Walaa Amer, Uday das, Fadi Kurdahi

ConfLayers: Adaptive Confidence-based Layer Skipping for Self-Speculative Decoding

Walaa Amer, Uday das, Fadi Kurdahi / April 17, 2026

arXiv:2604.14612v1 Announce Type: new
Abstract: Self-speculative decoding is an inference technique for large language models designed to speed up generation without sacrificing output quality. It combines fast, approximate decoding using a compact ve…

Author name: Walaa Amer, Uday das, Fadi Kurdahi

ConfLayers: Adaptive Confidence-based Layer Skipping for Self-Speculative Decoding