Ming-Hua Tsai, Phat Tran

Reward-Based Online LLM Routing via NeuralUCB

Ming-Hua Tsai, Phat Tran / April 1, 2026

arXiv:2603.30035v1 Announce Type: cross
Abstract: This study investigates the use of NeuralUCB for cost-aware large language model (LLM) routing. Existing routing approaches can be broadly grouped into supervised routing methods and partial-feedback m…

Author name: Ming-Hua Tsai, Phat Tran

Reward-Based Online LLM Routing via NeuralUCB