昇腾 - AscendCL C++应用开发 Host与Device的数据传输 函数的封装

2024-08-22 03:12

本文主要是介绍昇腾 - AscendCL C++应用开发 Host与Device的数据传输 函数的封装,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

昇腾 - AscendCL C++应用开发 Host与Device的数据传输 函数的封装

flyfish

aclrtGetRunMode

函数功能:获取当前昇腾AI软件栈的运行模式。
aclError aclrtGetRunMode(aclrtRunMode *runMode)

参数说明:runMode 运行模式的指针。
ACL_DEVICE:昇腾AI软件栈运行在Device的Control CPU或板端环境上。

Atlas 训练系列产品,Atlas A2训练系列产品/Atlas 800I A2推理产品,不支持该选项。

ACL_HOST:昇腾AI软件栈运行在Host CPU上。

对当前昇腾AI软件栈的运行模式函数进行封装

int GetRunMode()
{aclrtRunMode runMode;aclrtGetRunMode(&runMode);if (runMode==ACL_HOST) {return 1;}return 0;
}

区分昇腾AI软件栈运行在哪

Host指与Device相连接的X86服务器、ARM服务器,会利用Device提供的NN(Neural-Network )计算能力,完成业务。

Device指安装了昇腾AI处理器的硬件设备,利用PCIe接口与Host侧连接,为Host提供NN计算能力。

如果查询结果为ACL_HOST,则数据传输时涉及申请Host上的内存。
如果查询结果为ACL_DEVICE,则数据传输时仅需申请Device上的内存。

ImageProc imageProcess;
ImageData frame;
ImageSize modelSize(modelWidth, modelHeight);
int isHost = GetRunMode();ImageData dst;
imageProcess.Resize(frame, dst, modelSize, RESIZE_PROPORTIONAL_UPPER_LEFT);
MsgData msgData;
msgData.data = dst.data;
msgData.size = dst.size;
msgData.videoEnd = false;
cv::Mat yuyvImg(frame.height*1.5, frame.width, CV_8UC1);
if (isHost) {//昇腾AI软件栈运行在Host CPU上的处理方式void* hostDataBuffer = CopyDataToHost(frame.data.get(), frame.size);memcpy(yuyvImg.data, (unsigned char*)hostDataBuffer, frame.size);FreeHostMem(hostDataBuffer);hostDataBuffer = nullptr;} else {//昇腾AI软件栈运行在Device的Control CPU或板端环境上memcpy(yuyvImg.data, (unsigned char*)frame.data.get(), frame.size);}
cv::cvtColor(yuyvImg, msgData.srcImg, cv::COLOR_YUV2RGB_NV21);

从Host到Device的数据传输 函数的封装

void* CopyDataToDevice(void* data, uint32_t size) {void* devicePtr = nullptr;aclError aclRet = aclrtMalloc(&devicePtr, size, ACL_MEM_MALLOC_NORMAL_ONLY);CHECK_RET(aclRet == ACL_SUCCESS, LOG_PRINT("[ERROR] aclrtMalloc failed. ERROR: %d", aclRet); return nullptr);aclrtRunMode runMode;aclrtGetRunMode(&runMode);if (runMode == ACL_HOST) {aclRet = aclrtMemcpy(devicePtr, size, data, size, ACL_MEMCPY_HOST_TO_DEVICE);if (aclRet != ACL_SUCCESS) {LOG_PRINT("[ERROR] aclrtMemcpy failed. ERROR: %d", aclRet);aclrtFree(devicePtr);devicePtr = nullptr;return devicePtr;}} else {aclRet = aclrtMemcpy(devicePtr, size, data, size, ACL_MEMCPY_DEVICE_TO_DEVICE);if (aclRet != ACL_SUCCESS) {LOG_PRINT("[ERROR] aclrtMemcpy failed. ERROR: %d", aclRet);aclrtFree(devicePtr);devicePtr = nullptr;return devicePtr;}}return devicePtr;
}

从Device到Host的数据传输 函数的封装

void* CopyDataToHost(void* data, uint32_t size) {void* hostPtr = nullptr;aclError aclRet = aclrtMallocHost(&hostPtr, size);CHECK_RET(aclRet == ACL_SUCCESS, LOG_PRINT("[ERROR] aclrtMalloc failed. ERROR: %d", aclRet); return nullptr);aclrtRunMode runMode;aclrtGetRunMode(&runMode);if (runMode == ACL_HOST) {aclRet = aclrtMemcpy(hostPtr, size, data, size, ACL_MEMCPY_DEVICE_TO_HOST);if (aclRet != ACL_SUCCESS) {LOG_PRINT("[ERROR] aclrtMemcpy failed. ERROR: %d", aclRet);aclrtFreeHost(hostPtr);hostPtr = nullptr;return hostPtr;}} else {aclRet = aclrtMemcpy(hostPtr, size, data, size, ACL_MEMCPY_DEVICE_TO_HOST);if (aclRet != ACL_SUCCESS) {LOG_PRINT("[ERROR] aclrtMemcpy failed. ERROR: %d", aclRet);aclrtFreeHost(hostPtr);hostPtr = nullptr;return hostPtr;}}return hostPtr;
}

内存释放的封装 使用完内存中的数据后,需及时释放资源

void FreeHostMem(void*& hostPtr) {aclrtFreeHost(hostPtr);hostPtr = nullptr;
}void FreeDeviceMem(void*& devicePtr) {aclrtFree(devicePtr);devicePtr = nullptr;
}

void*& 是 C++ 中的一种参数类型,表示一个指向 void* 类型的引用。为了理解它的含义,分两步来解释:

void*: 这是一个通用指针类型,可以指向任何类型的数据,但它本身不携带类型信息。通常用来处理原始内存块或不确定类型的指针。

& (引用): 在 C++ 中,引用(reference)是一种别名,它允许直接操作原对象而不创建副本。void*& 是一个指向 void* 类型的引用,意味着可以在函数中直接操作传入的 void* 指针,而不需要复制指针的值。

例如在 FreeHostMem 函数中,void*& hostPtr 作为参数传入,意味着这个函数可以修改 hostPtr 指针的值,并且这些修改会反映在调用者的变量中。这在函数内部将 hostPtr 设置为 nullptr 后,调用者也会看到指针被设置为 nullptr,防止悬空指针的出现

aclrtMemcpy 函数原型

aclError aclrtMemcpy(void *dst, size_t destMax, const void *src, size_t count, aclrtMemcpyKind kind)
dst:目的内存地址指针。
destMax:目的内存地址的最大内存长度,单位Byte。
src:源内存地址指针。
count:内存复制的长度,单位Byte。
kind:内存复制的类型,预留参数,配置枚举值中的值无效,系统内部会根据源内存地址指针、目的内存地址指针判断是否可以将源地址的数据复制到目的地址,如果不可以,则系统会返回报错。

typedef enum aclrtMemcpyKind {
ACL_MEMCPY_HOST_TO_HOST, // Host内的内存复制
ACL_MEMCPY_HOST_TO_DEVICE, // Host到Device的内存复制
ACL_MEMCPY_DEVICE_TO_HOST, // Device到Host的内存复制
ACL_MEMCPY_DEVICE_TO_DEVICE, // Device内或Device间的内存复制
} aclrtMemcpyKind;

这篇关于昇腾 - AscendCL C++应用开发 Host与Device的数据传输 函数的封装的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1095071

相关文章

这15个Vue指令,让你的项目开发爽到爆

1. V-Hotkey 仓库地址: github.com/Dafrok/v-ho… Demo: 戳这里 https://dafrok.github.io/v-hotkey 安装: npm install --save v-hotkey 这个指令可以给组件绑定一个或多个快捷键。你想要通过按下 Escape 键后隐藏某个组件,按住 Control 和回车键再显示它吗?小菜一碟: <template

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

【C++ Primer Plus习题】13.4

大家好,这里是国中之林! ❥前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。有兴趣的可以点点进去看看← 问题: 解答: main.cpp #include <iostream>#include "port.h"int main() {Port p1;Port p2("Abc", "Bcc", 30);std::cout <<

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

C++包装器

包装器 在 C++ 中,“包装器”通常指的是一种设计模式或编程技巧,用于封装其他代码或对象,使其更易于使用、管理或扩展。包装器的概念在编程中非常普遍,可以用于函数、类、库等多个方面。下面是几个常见的 “包装器” 类型: 1. 函数包装器 函数包装器用于封装一个或多个函数,使其接口更统一或更便于调用。例如,std::function 是一个通用的函数包装器,它可以存储任意可调用对象(函数、函数

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

hdu1171(母函数或多重背包)

题意:把物品分成两份,使得价值最接近 可以用背包,或者是母函数来解,母函数(1 + x^v+x^2v+.....+x^num*v)(1 + x^v+x^2v+.....+x^num*v)(1 + x^v+x^2v+.....+x^num*v) 其中指数为价值,每一项的数目为(该物品数+1)个 代码如下: #include<iostream>#include<algorithm>

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设