Hadas Kotek, Margit Bowler, Patrick Sonnenberg, Yu'an Yang

ProText: A benchmark dataset for measuring (mis)gendering in long-form texts

Hadas Kotek, Margit Bowler, Patrick Sonnenberg, Yu'an Yang / March 31, 2026

arXiv:2603.27838v1 Announce Type: new
Abstract: We introduce ProText, a dataset for measuring gendering and misgendering in stylistically diverse long-form English texts. ProText spans three dimensions: Theme nouns (names, occupations, titles, kinship…

Author name: Hadas Kotek, Margit Bowler, Patrick Sonnenberg, Yu'an Yang

ProText: A benchmark dataset for measuring (mis)gendering in long-form texts