Author name: Nikolai Warner, Cameron Ethan Taylor, Irfan Essa, Apaar Sadhwani

MoCHA: Denoising Caption Supervision for Motion-Text Retrieval

Nikolai Warner, Cameron Ethan Taylor, Irfan Essa, Apaar Sadhwani / April 8, 2026

arXiv:2603.23684v2 Announce Type: replace
Abstract: Text-motion retrieval systems learn shared embedding spaces from motion-caption pairs via contrastive objectives. However, each caption is not a deterministic label but a sample from a distribution o…

cs.CV

MoCHA: Denoising Caption Supervision for Motion-Text Retrieval

Nikolai Warner, Cameron Ethan Taylor, Irfan Essa, Apaar Sadhwani / March 26, 2026

arXiv:2603.23684v1 Announce Type: new
Abstract: Text-motion retrieval systems learn shared embedding spaces from motion-caption pairs via contrastive objectives. However, each caption is not a deterministic label but a sample from a distribution of va…