Daisuke Oba, Danushka Bollegala, Masahiro Kaneko, Naoaki Okazaki

Stopping Computation for Converged Tokens in Masked Diffusion-LM Decoding

Daisuke Oba, Danushka Bollegala, Masahiro Kaneko, Naoaki Okazaki / May 13, 2026

arXiv:2602.06412v3 Announce Type: replace
Abstract: Masked Diffusion Language Models generate sequences via iterative sampling that progressively unmasks tokens. However, they still recompute the attention and feed-forward blocks for every token posit…

Author name: Daisuke Oba, Danushka Bollegala, Masahiro Kaneko, Naoaki Okazaki

Stopping Computation for Converged Tokens in Masked Diffusion-LM Decoding