Nicholas Potteiger, Ankita Samaddar, Taylor T. Johnson, Xenofon Koutsoukos

Reward Shaping and Action Masking for Compositional Tasks using Behavior Trees and LLMs

Nicholas Potteiger, Ankita Samaddar, Taylor T. Johnson, Xenofon Koutsoukos / May 8, 2026

arXiv:2605.05795v1 Announce Type: new
Abstract: Decomposing complex tasks into a sequence of simpler subtasks can improve learning efficiency for an autonomous agent. Reinforcement learning (RL) can be used to optimize agent policies to complete subta…

Author name: Nicholas Potteiger, Ankita Samaddar, Taylor T. Johnson, Xenofon Koutsoukos

Reward Shaping and Action Masking for Compositional Tasks using Behavior Trees and LLMs