Massa Baali, Rita Singh, Bhiksha Raj

DELULU: Discriminative Embedding Learning Using Latent Units for Speaker-Aware Self-Trained Speech Foundational Model

Massa Baali, Rita Singh, Bhiksha Raj / March 26, 2026

arXiv:2510.17662v2 Announce Type: replace-cross
Abstract: Self-supervised speech models have achieved remarkable success on content-driven tasks, yet they remain limited in capturing speaker-discriminative features critical for verification, diarizati…

Author name: Massa Baali, Rita Singh, Bhiksha Raj

DELULU: Discriminative Embedding Learning Using Latent Units for Speaker-Aware Self-Trained Speech Foundational Model