Mia Hopman, Jannes Elstner, Maria Avramidou, Amritanshu Prasad, David Lindner

Evaluating and Understanding Scheming Propensity in LLM Agents

Mia Hopman, Jannes Elstner, Maria Avramidou, Amritanshu Prasad, David Lindner / March 31, 2026

arXiv:2603.01608v2 Announce Type: replace
Abstract: As frontier language models are increasingly deployed as autonomous agents pursuing complex, long-term objectives, there is increased risk of scheming: agents covertly pursuing misaligned goals. Prio…

Author name: Mia Hopman, Jannes Elstner, Maria Avramidou, Amritanshu Prasad, David Lindner

Evaluating and Understanding Scheming Propensity in LLM Agents