Justin williams, Kishor Datta Gupta, Roy George, Mrinmoy Sarkar

LiteVLA-H: Dual-Rate Vision-Language-Action Inference for Onboard Aerial Guidance and Semantic Perception

Justin williams, Kishor Datta Gupta, Roy George, Mrinmoy Sarkar / May 12, 2026

arXiv:2605.00884v2 Announce Type: replace
Abstract: Vision-language-action (VLA) models have shown strong semantic grounding and task generalization in manipulation, but aerial deployment remains difficult because drones require low-latency closed-loo…

Author name: Justin williams, Kishor Datta Gupta, Roy George, Mrinmoy Sarkar

LiteVLA-H: Dual-Rate Vision-Language-Action Inference for Onboard Aerial Guidance and Semantic Perception