Constantinos Karouzos, Xingwei Tan, Nikolaos Aletras

Where does output diversity collapse in post-training?

Constantinos Karouzos, Xingwei Tan, Nikolaos Aletras / April 20, 2026

arXiv:2604.16027v1 Announce Type: cross
Abstract: Post-trained language models produce less varied outputs than their base counterparts. This output diversity collapse undermines inference-time scaling methods that rely on varied samples, and risks ho…

Author name: Constantinos Karouzos, Xingwei Tan, Nikolaos Aletras

Where does output diversity collapse in post-training?