Thet Htar Su, Shaswot Shresthamali, Masaaki Kondo

Scalable Quantum Reinforcement Learning on NISQ Devices with Dynamic-Circuit Qubit Reuse and Grover Optimization

Thet Htar Su, Shaswot Shresthamali, Masaaki Kondo / April 23, 2026

arXiv:2509.16002v2 Announce Type: replace-cross
Abstract: A scalable and resource-efficient quantum reinforcement learning framework is presented that eliminates the linear qubit-scaling barrier in multi-step quantum Markov decision processes (QMDPs)….

Author name: Thet Htar Su, Shaswot Shresthamali, Masaaki Kondo

Scalable Quantum Reinforcement Learning on NISQ Devices with Dynamic-Circuit Qubit Reuse and Grover Optimization