Shubham Aggarwal, Lokendra Kumar

Rethinking Attention Output Projection: Structured Hadamard Transforms for Efficient Transformers

Shubham Aggarwal, Lokendra Kumar / March 31, 2026

arXiv:2603.08343v2 Announce Type: replace
Abstract: The dense output projection in multi head attention scales quadratically with model dimension, contributing significantly to parameter count, memory footprint, and inference cost. We propose replacin…

Author name: Shubham Aggarwal, Lokendra Kumar

Rethinking Attention Output Projection: Structured Hadamard Transforms for Efficient Transformers