NVDLA专题12：具体模块介绍—

NVDLA专题12：具体模块介绍——RUBIK

本文主要是介绍NVDLA专题12：具体模块介绍——RUBIK，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

概述

RUBIK类似于BDMA，它无需任何数据计算对数据映射格式进行转换。RUBIK有3种工作模式，分别是:

由于该模块的功能是转换特征数据立方体，我们称之为RUBIK单元。

软件反卷积层总是使用几个硬件层或两个阶段。第一阶段是卷积流水线产生结果，第二阶段是contract的合同模式。

正常情况下，SW反卷积层的反卷积 x stride和 y stride大于1。通过这些strides的扩展，第一阶段硬件层的输出是一个通道扩展的数据立方体。RUBIK中的contract模式转换映射格式来扩展立方体。下图显示了一个重新映射示例，其中x stride为2，y stride 为3。

输入立方体大小和输出立方体大小的公式为:

RUBIK引擎slice by sclice 地实现contract，它接受一个Wx1xC输入sclice，并将其转换为一个W'xH'xC '输出子多维数据子立方体。然后继续到下一个输入slice，它从不跨线路边界发送请求。

当执行contract时，输入/输出起始地址和行间距应与32 bytes对齐。它总是试图发送256 bytes的请求，存储效率在80%~100%之间，受起始地址的影响。如果所有地址stride和起始地址都是256 byte对齐的，则存储器效率达到100%。

contract模式的要求:

拆分和合并是RUBIK中两种相反的操作模式。Split将数据立方体转换为M平面格式(M-planar formats, NCHW)，平面的数量等于通道尺寸。合并模式将一系列平面转换为要特征据立方体。转换如下图所示。

M平面格式类似于图像格式。它是一种pitch linear格式，包含T_R16_I、T_R8_I或T_R16_F数据。每个平面仅包含1个通道数据或单个元素，所有平面(M平面)的line stride和planar stride应与64bytes对齐。它不同于NVDLA的其他数据格式。

RUBIK单元在数据路径中应用时钟门控，当单元空闲且可编程寄存器中没有可用的硬件层时，RUBIK数据路径的时钟被选通（gated）。

这篇关于NVDLA专题12：具体模块介绍——RUBIK的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！