Shu Yang, Zihao Zhou, Di Wang, Wenda Li

Hierarchical Alignment: Enforcing Hierarchical Instruction-Following in LLMs through Logical Consistency

Shu Yang, Zihao Zhou, Di Wang, Wenda Li / April 13, 2026

arXiv:2604.09075v1 Announce Type: new
Abstract: Large language models increasingly operate under multiple instructions from heterogeneous sources with different authority levels, including system policies, user requests, tool outputs, and retrieved co…

Author name: Shu Yang, Zihao Zhou, Di Wang, Wenda Li

Hierarchical Alignment: Enforcing Hierarchical Instruction-Following in LLMs through Logical Consistency