Zijian Zeng, Fei Ding, Huiming Yang, Xianwei Li

HELM: Harness-Enhanced Long-horizon Memory for Vision-Language-Action Manipulation

Zijian Zeng, Fei Ding, Huiming Yang, Xianwei Li / April 22, 2026

arXiv:2604.18791v1 Announce Type: new
Abstract: Vision-Language-Action (VLA) models fail systematically on long-horizon manipulation tasks despite strong short-horizon performance. We show that this failure is not resolved by extending context length …

Author name: Zijian Zeng, Fei Ding, Huiming Yang, Xianwei Li

HELM: Harness-Enhanced Long-horizon Memory for Vision-Language-Action Manipulation