Prasanna Desikan, Harshit Rajgarhia, Shivali Dalmia, Ananya Mantravadi

Measuring What Matters: Benchmarking Generative, Multimodal, and Agentic AI in Healthcare

Prasanna Desikan, Harshit Rajgarhia, Shivali Dalmia, Ananya Mantravadi / May 12, 2026

arXiv:2605.08445v1 Announce Type: new
Abstract: AI models are increasingly deployed in live clinical environments where they must perform reliably across complex, high-stakes workflows that standard training and validation datasets were never designed…

Author name: Prasanna Desikan, Harshit Rajgarhia, Shivali Dalmia, Ananya Mantravadi

Measuring What Matters: Benchmarking Generative, Multimodal, and Agentic AI in Healthcare