Andor V\'ari-Kakas, Ji Won Park, Natasa Tagasovska

MGDA-Decoupled: Geometry-Aware Multi-Objective Optimisation for DPO-based LLM Alignment

Andor V\'ari-Kakas, Ji Won Park, Natasa Tagasovska / April 23, 2026

arXiv:2604.20685v1 Announce Type: new
Abstract: Aligning large language models (LLMs) to desirable human values requires balancing multiple, potentially conflicting objectives such as helpfulness, truthfulness, and harmlessness, which presents a multi…

Author name: Andor V\'ari-Kakas, Ji Won Park, Natasa Tagasovska

MGDA-Decoupled: Geometry-Aware Multi-Objective Optimisation for DPO-based LLM Alignment