Christine Zhang, Dan Jurafsky, Chen Shani

Concept Training for Human-Aligned Language Models

Christine Zhang, Dan Jurafsky, Chen Shani / April 1, 2026

arXiv:2603.29123v1 Announce Type: new
Abstract: The next-token prediction (NTP) objective trains language models to predict a single continuation token at each step. In natural language, however, a prefix can be continued in many valid ways, and even …

Author name: Christine Zhang, Dan Jurafsky, Chen Shani

Concept Training for Human-Aligned Language Models