本文主要是介绍GNN algorithms(7): Flash Attention,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
目录
Background
参考
Flash Attention: Fast and Memory-Efficient Exact Attention with IO-Awareness
Background
HBM: high Boardwidth memory, 高带宽内存
SRAM: Static RAM, 静态随机存储器
Flash Attention 分而治之的思想
参考
Flash Attention论文解读 - 李理的博客
https://gordicaleksa.medium.com/eli5-flash-attention-5c44017022ad
这篇关于GNN algorithms(7): Flash Attention的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!