Yunsu Kim, Kaden Uhlig, Joern Wuebker

GAIA-v2-LILT: Multilingual Adaptation of Agent Benchmark beyond Translation

Yunsu Kim, Kaden Uhlig, Joern Wuebker / April 29, 2026

arXiv:2604.24929v1 Announce Type: new
Abstract: Agent benchmarks remain largely English-centric, while their multilingual versions are often built with machine translation (MT) and limited post-editing. We argue that, for agentic tasks, this minimal w…

Author name: Yunsu Kim, Kaden Uhlig, Joern Wuebker

GAIA-v2-LILT: Multilingual Adaptation of Agent Benchmark beyond Translation