Guan-Ting Lin, Chen Chen, Zhehuai Chen, Hung-yi Lee

Full-Duplex-Bench-v3: Benchmarking Tool Use for Full-Duplex Voice Agents Under Real-World Disfluency

Guan-Ting Lin, Chen Chen, Zhehuai Chen, Hung-yi Lee / April 7, 2026

arXiv:2604.04847v1 Announce Type: cross
Abstract: We introduce Full-Duplex-Bench-v3 (FDB-v3), a benchmark for evaluating spoken language models under naturalistic speech conditions and multi-step tool use. Unlike prior work, our dataset consists entir…

Author name: Guan-Ting Lin, Chen Chen, Zhehuai Chen, Hung-yi Lee

Full-Duplex-Bench-v3: Benchmarking Tool Use for Full-Duplex Voice Agents Under Real-World Disfluency