Jetson TX2的计算能力

2023-10-08 05:20
文章标签 jetson tx2 计算能力

本文主要是介绍Jetson TX2的计算能力,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

TX2的GPU算力

GPU的浮点计算理论峰值能力公式如下:

理 论 峰 值 = G P U 芯 片 数 量 * G P U B o o s t 主 频 * 核 心 数 量 * 单 个 时 钟 周 期 内 能 处 理 的 浮 点 计 算 次 数 理论峰值 = GPU芯片数量*GPU Boost主频*核心数量*单个时钟周期内能处理的浮点计算次数 GPUGPUBoost

TX2的参数如下:
在这里插入图片描述在这里插入图片描述

第五代的Pascal架构里,FP64单元和FP32单元的比例是1:2,

因此,TX2的单精度浮点计算能力为:
F P 32 c o r e s * 1302 M H z * 256 * 2 = 0.63 T F L O P S FP32 cores*1302MHz*256*2=0.63TFLOPS FP32cores1302MHz2562=0.63TFLOPS

TX2的双精度浮点计算能力为
F P 64 c o r e s * 1302 M H z * 128 * 2 = 0.31 T F L O P S FP64 cores*1302MHz*128*2=0.31TFLOPS FP64cores1302MHz1282=0.31TFLOPS

鉴于,P100还支持在一个FP32里同时进行2次FP16的半精度浮点计算,所以合理怀疑TX2具有这种能力,因此对于半精度的理论峰值更是单精度浮点数计算能力的两倍也就是达到1.26TFlops 。

在这里插入图片描述

这个结果符合官方文献资料的描述符合。

泰坦X的GPU算力

在这里插入图片描述
泰坦X的单精度浮点计算能力为
F P 32 c o r e s * 1531 M H z * 3584 * 2 = 10.6 T F L O P S FP32 cores*1531MHz*3584*2=10.6TFLOPS FP32cores1531MHz35842=10.6TFLOPS

泰坦X也属于第五代的Pascal架构里,FP64单元和FP32单元的比例是1:2, 因此,其双精度计算能力为:

F P 64 c o r e s * 1531 M H z * 1792 * 2 = 5.3 T F L O P S FP64 cores*1531MHz*1792*2=5.3TFLOPS FP64cores1531MHz17922=5.3TFLOPS

这篇关于Jetson TX2的计算能力的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/162987

相关文章

完整指南:CNStream流处理多路并发框架适配到NVIDIA Jetson Orin (二) 源码架构流程梳理、代码编写

目录 1 视频解码代码编写----利用jetson-ffmpeg 1.1 nvstream中视频解码的代码流程框架 1.1.1 类的层次关系 1.1.2 各个类的初始化函数调用层次关系 1.1.3 各个类的process函数调用层次关系 1.2 编写视频解码代码 1.2.1 修改VideoInfo结构体定义 1.2.2 修改解封装代码 1.2.3 decode_impl_nv.h

TX2安装pip工具

在TX2上安装pip可使用以下命令: sudo apt install python-pip 但是使用该命令在安装过程中,大概率会出现问题,在下载文件过程中,有的网络不好引起的,有的权限问题,还有些其他的问题。所以安装pip最保险的方式是将下载好的pip包直接拷贝进行安装。 pip安装包下载链接:链接: https://pan.baidu.com/s/13dCx3ZK8i_QyH4RkrG6

TX2板子opencv安装

在TX2板子上安装opencv有两种方式,一种是你使用cmake直接在TX2上编译源码,第二种是使用你已编译好的opencv在TX2上进行配置,第二种方式需要注意你编译的版本也是在ARM平台编译的才能生效。 第一种方式可见我之前的博文《Linux下使用cmake编译opencv库》。本文主要介绍第二种方式,编译opencv比较耗时,有时候直接使用已编译好的版本进行配置省很多时间。 注:本文的配

TX2上darknet框架编译问题梳理

darknet源码下载:https://github.com/pjreddie/darknet 1. 编译设置 打开darknet的源码根目录,里面有Makefile文件,根据需要编译相关模块: darknet的opencv模块采用了1.x版本的IplImage数据类型以及有许多1.x版本的API接口,该类型以及相关的接口在opencv4+版本中已被弃用。因此编译opencv时需注意,D

Jetson Xavier NX apt更换国内源

在xavier NX板子上安装软件包的时候,网速特别慢,于是想更换源,网上找到了如下博客,验证可用。 原文地址 [NVIDIA]-3 入手 Jetson Xavier NX apt更换国内源_darnell888的博客-CSDN博客 本文主要讲述,基于 Jetson Xavier NX 开发者套件apt更换国内源。 What is Jetson Xavier NX :  NVIDIA® Jet

NVIDIA Jetson xavier NX安装torchvision

上一篇文章里面记录了在xavier NX上安装pytorch,https://www.cnblogs.com/cumtchw/p/13273753.html 然后接下来安装torchvision,下面是英伟达官网上的torchvision的安装方法:https://forums.developer.nvidia.com/t/pytorch-for-jetson-nano-version-1-5-

Jetson AGX Xavier避坑指南(三)——环境搭建1.(python3、pip、virtualenv、ros)_转载

原文网址如下:https://blog.csdn.net/zxxxiazai/article/details/103419986

Jetson xavier NX 485串口接口封装/Jetson Xavier NX 串口通讯

目录 1.查看Jetson Xavier NX串口 2.硬件调试环境搭建 3.代码 3.1.dataType.h 3.2.rs485Service.h 3.3 rs485Service.cpp 3.4 demo 4 实验结果 1.查看Jetson Xavier NX串口 首先查看NX板子上的串口,执行 ll /dev | grep tty 可以看到串口,这次我们使用ttyT

jetson xavier nx 编译使用 libtorch

不能直接下载编译好的。使用起来会报错要自己编译,详细根据自己的 JetPack 去下载对应版本 下载地址:JetPack libtorch下载地址 3.安装 sudo apt-get update sudo apt-get upgradesudo apt-get install python3-pip libopenblas-base libopenmpi-devpip3 instal

NVIDIA Jetson Orin Nano Spidev 使用教程

系列文章目录 前言 该项目包含一个 python 模块,用于通过 spidev linux 内核驱动程序从用户空间连接 SPI 设备。 除非另有明确说明,否则所有代码均已获得 MIT 许可。 一、使用方法 import spidevspi = spidev.SpiDev()spi.open(bus, device)to_send = [0x01, 0x02, 0x0