/u/JC1DA - Provide.ai

Power-limit vs TG/s for 2×3090

/u/JC1DA / April 28, 2026

Trying to find the sweet-spot to tradeoff between power and tg/s. 250W seems to be a sweet spot for Qwen3.6-27B. It's interesting that I got higher tg/s at 275W for 1 concurrent request VLLM-server-config from tedivm vllm serve /models/Qwen3…

Author name: /u/JC1DA

Power-limit vs TG/s for 2×3090