Dang H. Dang, Jelena Mitrovi, Michael Granitzer

Toward Generalized Cross-Lingual Hateful Language Detection with Web-Scale Data and Ensemble LLM Annotations

Dang H. Dang, Jelena Mitrovi, Michael Granitzer / April 14, 2026

arXiv:2604.09625v1 Announce Type: new
Abstract: We study whether large-scale unlabelled web data and LLM-based synthetic annotations can improve multilingual hate speech detection. Starting from texts crawled via OpenWebSearch.eu~(OWS) in four languag…

Author name: Dang H. Dang, Jelena Mitrovi, Michael Granitzer

Toward Generalized Cross-Lingual Hateful Language Detection with Web-Scale Data and Ensemble LLM Annotations