Zhijie Cai, Haolong Chen, Guangxu Zhu

AdaMeZO: Adam-style Zeroth-Order Optimizer for LLM Fine-tuning Without Maintaining the Moments

Zhijie Cai, Haolong Chen, Guangxu Zhu / May 4, 2026

arXiv:2605.00650v1 Announce Type: cross
Abstract: Fine-tuning LLMs is necessary for various dedicated downstream tasks, but classic backpropagation-based fine-tuning methods require substantial GPU memory. To this end, a recent work, MeZO, which relie…

Author name: Zhijie Cai, Haolong Chen, Guangxu Zhu

AdaMeZO: Adam-style Zeroth-Order Optimizer for LLM Fine-tuning Without Maintaining the Moments