本文主要是介绍tensor core实现矩阵乘法的详细解读,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
之前关于tensor core的介绍可以参考链接添加链接描述
基础的tensor core实现C=AB的代码可以参考下面这段内容:
上面代码的几个注意事项:
首先是加载mma.h头文件,这个是包含wmma模板类的头文件。
其次是设置的WMMA_M=16,WMMA_N=16,WMMA_K=8,这三个参数的表示的意思是,对于一个线程块内的一个warp来说,这个线程簇warp一次能处理的是[16,8]@[8,16]这样小矩阵乘法。
wmma::fragment<wmma::ma
这篇关于tensor core实现矩阵乘法的详细解读的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!