本文主要是介绍gemm函数详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
参考链接:https://software.intel.com/en-us/node/520775
http://www.cnblogs.com/darkknightzh/p/5553336.html
函数原型:
void cblas_sgemm (const CBLAS_LAYOUT Layout, const CBLAS_TRANSPOSE transa, constCBLAS_TRANSPOSE transb, const MKL_INT m, const MKL_INT n, const MKL_INT k, const float alpha,const float *a, const MKL_INT lda, const float *b, const MKL_INT ldb, const float beta, float *c,const MKL_INT ldc);
功能:
C := alpha*op(A)*op(B) + beta*C,
op:表示转置与否,由参数transa 和transb控制
op(A):m*k矩阵 op(B):k*n矩阵 c:m*n矩阵
参数解释:
Layout:表示矩阵的存储方式,有CblasRowMajor(行主序)和CblasColMajor(列主序)两种。即对于m行n列矩阵A(m*n),若为行主序,则将矩阵按照行的方式依次存储;若为列主序,则依次存储矩阵的每一列。后面的分析以行主序为例
transa/transb: 分别控制矩阵A、B是否做转置变化。有CblasNoTrans和CblasTrans两种形式。
m:表示op(A)和C的行数
n:op(B)和C的列数
k:op(A)的列数和op(B)的行数
alpha:
a:生成矩阵A
NoTrans Trans
ColMajor: A=a的左上m*k部分,a为lda*k矩阵, lda>max(1,m)A=a的k*m部分,a为lda*m, lda>max(1,k)
RowMajor: A=a的左上k*m部分,a为lda*m矩阵,lda>max(1,k)A=a的m*k部分,a为lda*k, lda>max(1,m)
lda:如上描述
b:生成矩阵B
ldb:
beta:
C:结果输出矩阵C
ColMajor: A=c的左上m*n部分,c为ldc*n矩阵, lda>max(1,m) RowMajor: A=a的左上n*m部分,a为ldc*m矩阵,lda>max(1,n)
这篇关于gemm函数详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!