Maxence Hussonnois, Thommen George Karimpanal, Santu Rana

Leveraging Human Feedback for Semantically-Relevant Skill Discovery

Maxence Hussonnois, Thommen George Karimpanal, Santu Rana / April 28, 2026

arXiv:2604.24127v1 Announce Type: cross
Abstract: Unsupervised skill discovery in reinforcement learning aims to intrinsically motivate agents to discover diverse and useful behaviours. However, unconstrained approaches can produce unsafe, unethical, …

Author name: Maxence Hussonnois, Thommen George Karimpanal, Santu Rana

Leveraging Human Feedback for Semantically-Relevant Skill Discovery