本文主要是介绍深度学习常用算子,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
深度学习常用算子
算子 | 功能 |
---|---|
Relu | ReLU(x)=max(0,x) |
LeakyRelu | LeakyRelu(x) = (x >= 0 ? x : x*negative_slope) |
Relu6 | LeakyRelu(x) = max(max(x, 0), 6) |
Tan | tanh(x)=(exp(x)-exp(-x))/(exp(x)+exp(-x)) |
sigmoid | sigmoid(x) = 1. / (1. + exp(x)) |
PRelu | f(x) = max(x, 0) + slope_data[c] * min(x, 0) |
Add | + |
Sub | - |
Mul | * |
RealDiv | / |
BiasAdd | 用于增加bias操作,通常bias是一维Tensor |
MatMul | 矩阵乘 |
Axpy | 向量求和,公式:y += a * x |
EltwiseOp | 多个Tensor对应位置元素进行相乘、相加、取最大值中一种操作 |
BatchNorm | 加快神经网络的训练收敛速度 |
LRN | Local Response Normalization,即局部响应归一化层 LRN这个概念和运用是出现在AlexNet中。LRN最初是生物学里的概念“相邻神经元抑制”,对局部神经元的活动创建竞争机制。使用LRN增加了泛化能力(使输出中响应比较大的值变得相对更大,并抑制其他响应较小的神经元),做了平滑处理,提高了1%~2%的识别率。 |
SsdNormalize | 作用:限制了一次归一化的范围 使用网络:SSD |
Convolution | 分区域进行特征值提取 |
FullConnection | 看作一种特殊卷积层,或者看作矩阵乘;整个输入作为feature map,进行特征提取FC是一种迁移学习的结果,通常FC后面接Softmax,所以FC层的功能还包括矩阵维度变换,将维度变换为Softmax对应的维度 |
Correlation | 功能 |
DeConvolution | 采用分步计算的方法,完成普通3D核的计算,其好处在于提升卷积计算的效率 |
Pooling | Pooling的作用是将输入的图像划分为若干个矩形区域,对每个子区域输出最大值或平均值。Pooling减少了参数的数量,防止过拟合现象的发生。 |
Mean | 只有取均值功能的滑窗算子 |
ROIPooling | 对ROI进行pooling操作,从不同大小的方框得到固定大小相应 的feature maps 使用网络:Faster RCNN |
ROIAlign | 作用:解决ROIPooling两次量化带来的问题,使用线性插值的方式来解决。使用网络:Mask-RCNN |
PSROIPooling | 使用网络:R-FCN |
Flatten | 将输入tensor中从start_axis维度到end_axis维度合并为1维 |
Reshape | 将输入Tensor描述转换为新的shape |
FreespaceExtract | 将h维变成1,其他维度不变,从而完成对h的采样,采样值所在位置由输入的index参数决定 |
Pack | Pack算子为TensorFlow原生算子,最新的版本已经改名为:Stack。该算子以指定的轴axis,将一个维度为R的张量数组转变成一个维度为R+1的张量。 |
Pad | 进行数据扩充 |
Permute | 调整Tensor的输入维度顺序 |
ShuffleChannel | 作用:调整C维的排序 使用网络:ShuffleNet |
Title | 将输入数据在每个维度上复制指定次数来生成输出数据 |
Rsqrt | y = 1 / sqrt{x} |
Scale | y(x)=scale*x+bias |
AbsVal | y(x)= |
Power | f(x)= (scale * x + shift) ^ power |
Softmax | 通常作为分类网络的最后一层,输出每类的概率 |
ClipBoxes | 将输入的框坐标限制在[0,img_w-1]和[0,img_h-1]之间。 |
DecodeBoxes | 将输入框的长宽坐标转换为描点坐标(框中心点坐标和长宽),然后进行修正,修正后再替换回长宽坐标 |
DetectPostProcess | (1)对输入的框进行修正;(2)按照得分进行排序;(3)使用NMS进行过滤;(4)每个分类取前N个框输出。 |
FasterRcnnPredictions | 获取得分最高的N个框,需要进行NMS处理。 |
FSRDectionOutput | 作用:获取得分最高的N个框,需要进行NMS处理 输入数据:每个分类的得分数据、roi坐标、roi偏移、feature map的长和宽 使用网络:FasterRcnn |
GenerateRPNProposals | 作用:根据输入rois坐标和得分,输出排序和NMS处理后的前N个框,框坐标形式为左上角和右下角 使用网络:Mask Rcnn |
Proposal | 作用:根据锚点前后得分、锚点偏移、原始图片的长宽缩放,来获取得分最高的N个预选框;特点:对特征图上的每个点,生成scale*ratio个固定大小的窗口;即候选窗口是该算子生成的。 |
SsdDetectionOutput | 作用:用来生成预测框相对原图的真实坐标,并对所有预测框进行过滤,得到最终物体检测的结果。输出的每个预测框的信息包括image id ,lable, confidence以及四个坐标值。使用网络:SSD |
SsdPriorBox | 作用:生成预选框 使用网络:SSD |
Concat | 实现多个算子的拼接 |
spatial transform | 在CNN之前对feature map进行旋转、缩放、平移、剪切等操作.使用网络:Spatial Transformer Networks(STN) |
这篇关于深度学习常用算子的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!