Oscar Gilg, Pierre Beckmann, Daniel Paleka, Patrick Butlin

Probing Persona-Dependent Preferences in Language Models

Oscar Gilg, Pierre Beckmann, Daniel Paleka, Patrick Butlin / May 14, 2026

arXiv:2605.13339v1 Announce Type: cross
Abstract: Large language models (LLMs) can be said to have preferences: they reliably pick certain tasks and outputs over others, and preferences shaped by post-training and system prompts appear to shape much o…

Author name: Oscar Gilg, Pierre Beckmann, Daniel Paleka, Patrick Butlin

Probing Persona-Dependent Preferences in Language Models