在北大和deepseek发表那篇引发关注的原生稀疏注意力NSA论文()后,M

又仁看科技 2025-02-22 11:20:34

在北大和deepseek发表那篇引发关注的原生稀疏注意力NSA论文( )后,MIT博士Songlin Yang(松琳)根据论文做了个开源实现,项目托管在:github.com/fla-org/native-sparse-attention

通过基准测试(图2)也证实了其高效性。

0 阅读:65
又仁看科技

又仁看科技

感谢大家的关注