Jonas Landsgesell, Pascal Knoll, Tizian Wenzel

ScoringBench: A Benchmark for Evaluating Tabular Foundation Models with Proper Scoring Rules

Jonas Landsgesell, Pascal Knoll, Tizian Wenzel / April 28, 2026

arXiv:2603.29928v2 Announce Type: replace
Abstract: Tabular foundation models such as TabPFN and TabICL already produce full predictive distributions, yet prevailing regression benchmarks evaluate them almost exclusively via point-estimate metrics (RM…

Author name: Jonas Landsgesell, Pascal Knoll, Tizian Wenzel

ScoringBench: A Benchmark for Evaluating Tabular Foundation Models with Proper Scoring Rules