Amir Hossein Saleknia, Mohammad Sabokrou

What Are We Really Measuring? Rethinking Dataset Bias in Web-Scale Natural Image Collections via Unsupervised Semantic Clustering

Amir Hossein Saleknia, Mohammad Sabokrou / April 16, 2026

arXiv:2604.13610v1 Announce Type: new
Abstract: In computer vision, a prevailing method for quantifying dataset bias is to train a model to distinguish between datasets. High classification accuracy is then interpreted as evidence of meaningful semant…

Author name: Amir Hossein Saleknia, Mohammad Sabokrou

What Are We Really Measuring? Rethinking Dataset Bias in Web-Scale Natural Image Collections via Unsupervised Semantic Clustering