本文主要是介绍Jetson TX2的计算能力,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
TX2的GPU算力
GPU的浮点计算理论峰值能力公式如下:
理 论 峰 值 = G P U 芯 片 数 量 * G P U B o o s t 主 频 * 核 心 数 量 * 单 个 时 钟 周 期 内 能 处 理 的 浮 点 计 算 次 数 理论峰值 = GPU芯片数量*GPU Boost主频*核心数量*单个时钟周期内能处理的浮点计算次数 理论峰值=GPU芯片数量*GPUBoost主频*核心数量*单个时钟周期内能处理的浮点计算次数
TX2的参数如下:
第五代的Pascal架构里,FP64单元和FP32单元的比例是1:2,
因此,TX2的单精度浮点计算能力为:
F P 32 c o r e s * 1302 M H z * 256 * 2 = 0.63 T F L O P S FP32 cores*1302MHz*256*2=0.63TFLOPS FP32cores*1302MHz*256*2=0.63TFLOPS
TX2的双精度浮点计算能力为
F P 64 c o r e s * 1302 M H z * 128 * 2 = 0.31 T F L O P S FP64 cores*1302MHz*128*2=0.31TFLOPS FP64cores*1302MHz*128*2=0.31TFLOPS
鉴于,P100还支持在一个FP32里同时进行2次FP16的半精度浮点计算,所以合理怀疑TX2具有这种能力,因此对于半精度的理论峰值更是单精度浮点数计算能力的两倍也就是达到1.26TFlops 。
这个结果符合官方文献资料的描述符合。
泰坦X的GPU算力
泰坦X的单精度浮点计算能力为
F P 32 c o r e s * 1531 M H z * 3584 * 2 = 10.6 T F L O P S FP32 cores*1531MHz*3584*2=10.6TFLOPS FP32cores*1531MHz*3584*2=10.6TFLOPS
泰坦X也属于第五代的Pascal架构里,FP64单元和FP32单元的比例是1:2, 因此,其双精度计算能力为:
F P 64 c o r e s * 1531 M H z * 1792 * 2 = 5.3 T F L O P S FP64 cores*1531MHz*1792*2=5.3TFLOPS FP64cores*1531MHz*1792*2=5.3TFLOPS
这篇关于Jetson TX2的计算能力的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!