/u/niellsro - Provide.ai

Qwen 3.6 27b MTP vLLM

/u/niellsro / May 2, 2026

Hello everyone, i am banging my head trying to properly configure qwen 3.6 27b mtp in vllm. I am using vllm v0.20.0 in docker, unquantized model with tp4 (4 3090s), max context length. At low context size, mtp with value of 3 gives the best results: 4…

Author name: /u/niellsro

Qwen 3.6 27b MTP vLLM