Mohamed Rissal Hedna, Jan Strich, Martin Semmann, Chris Biemann

Self-Calibrating Language Models via Test-Time Discriminative Distillation

Mohamed Rissal Hedna, Jan Strich, Martin Semmann, Chris Biemann / April 14, 2026

arXiv:2604.09624v1 Announce Type: new
Abstract: Large language models (LLMs) are systematically overconfident: they routinely express high certainty on questions they often answer incorrectly. Existing calibration methods either require labeled valida…

Author name: Mohamed Rissal Hedna, Jan Strich, Martin Semmann, Chris Biemann

Self-Calibrating Language Models via Test-Time Discriminative Distillation