Author name: /u/ayake_ayake

[Paper on Hummingbird+: low-cost FPGAs for LLM inference] Qwen3-30B-A3B Q4 at 18 t/s token-gen, 24GB, expected $150 mass production cost

/u/ayake_ayake / May 3, 2026

submitted by /u/ayake_ayake [link] [comments]