chunkwise专题

flash-linear-attention中的Chunkwise并行算法的理解

这里提一下,我维护的几三个记录个人学习笔记以及社区中其它大佬们的优秀博客链接的仓库都获得了不少star,感谢读者们的认可,我也会继续在开源社区多做贡献。github主页:https://github.com/BBuf ,欢迎来踩 0x0. 前言 我之前解读过causal linear attention的cuda实现,文章见:https://zhuanlan.zhihu.com/p/673