Chenchen Yuan, Zheyu Zhang, Gjergji Kasneci

Where Paths Split: Localized, Calibrated Control of Moral Reasoning in Large Language Models

Chenchen Yuan, Zheyu Zhang, Gjergji Kasneci / May 6, 2026

arXiv:2605.03609v1 Announce Type: cross
Abstract: Large language models often display heterogeneous moral preferences across settings. We study inference-time steering toward a desired ethical framework while preserving general competence. We present …

Author name: Chenchen Yuan, Zheyu Zhang, Gjergji Kasneci

Where Paths Split: Localized, Calibrated Control of Moral Reasoning in Large Language Models