Youzhi Liu, Li Gao, Liu Liu, Mingyang Lv, Yang Cai

CoMaTrack: Competitive Multi-Agent Game-Theoretic Tracking with Vision-Language-Action Models

Youzhi Liu, Li Gao, Liu Liu, Mingyang Lv, Yang Cai / April 1, 2026

arXiv:2603.22846v2 Announce Type: replace
Abstract: Embodied Visual Tracking (EVT), a core dynamic task in embodied intelligence, requires an agent to precisely follow a language-specified target. Yet most existing methods rely on single-agent imitati…

Author name: Youzhi Liu, Li Gao, Liu Liu, Mingyang Lv, Yang Cai

CoMaTrack: Competitive Multi-Agent Game-Theoretic Tracking with Vision-Language-Action Models