本文主要是介绍总计算能力 TPP (Total Processing Performance) 是个什么概念?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
TPP = 2 * MacTOPS * bit length of the operation
- 所谓的MacTOPS,是指最大的相乘累加操作的能力,也就是D=A*B+C,算作一次操作。
- 前面要乘一次2,是因为乘和加,一次操作实际上是两次运算。
- 该操作的比特长度,我看有很多媒体误解为什么显存位宽了,这是错误的。这意思是说,比如FP32就要乘上32,FP16就乘以16,INT 8就乘以8。
PD=TPP/Die Size
MacTOPS:GPU卡数值最大的那一项计算能力,以T为单位。
4090:FP8稀疏为1320,FP8标准为660。 TPP=2*660*8=10560
L4:TPP=2*242.5*8=3880 PD=3880/294=9.85
这篇关于总计算能力 TPP (Total Processing Performance) 是个什么概念?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!