Jusen Du, Jiaxi Hu, Tao Zhang, Weigao Sun, Yu Cheng

Native Hybrid Attention for Efficient Sequence Modeling

Jusen Du, Jiaxi Hu, Tao Zhang, Weigao Sun, Yu Cheng / April 16, 2026

arXiv:2510.07019v3 Announce Type: replace-cross
Abstract: Transformers excel at sequence modeling but face quadratic complexity, while linear attention offers improved efficiency but often compromises recall accuracy over long contexts. In this work, …

Author name: Jusen Du, Jiaxi Hu, Tao Zhang, Weigao Sun, Yu Cheng

Native Hybrid Attention for Efficient Sequence Modeling