Avni Mittal, Shanu Kumar, Sandipan Dandapat, Monojit Choudhury

Litmus (Re)Agent: A Benchmark and Agentic System for Predictive Evaluation of Multilingual Models

Avni Mittal, Shanu Kumar, Sandipan Dandapat, Monojit Choudhury / April 13, 2026

arXiv:2604.08970v1 Announce Type: new
Abstract: We study predictive multilingual evaluation: estimating how well a model will perform on a task in a target language when direct benchmark results are missing. This problem is common in multilingual depl…

Author name: Avni Mittal, Shanu Kumar, Sandipan Dandapat, Monojit Choudhury

Litmus (Re)Agent: A Benchmark and Agentic System for Predictive Evaluation of Multilingual Models