Sangjun Song, Minjae Oh, Seungkyu Lee, Sungmin Jo, Yohan Jo

ThinkBrake: Efficient Reasoning via Log-Probability Margin Guided Decoding

Sangjun Song, Minjae Oh, Seungkyu Lee, Sungmin Jo, Yohan Jo / April 21, 2026

arXiv:2510.00546v5 Announce Type: replace
Abstract: Large Reasoning Models (LRMs) allocate substantial inference-time compute to Chain-of-Thought (CoT) reasoning, improving performance on mathematics, scientific QA, and tool usage. However, this intro…

Author name: Sangjun Song, Minjae Oh, Seungkyu Lee, Sungmin Jo, Yohan Jo

ThinkBrake: Efficient Reasoning via Log-Probability Margin Guided Decoding