非NVIDIA平台下的CUDA的替代方案OpenCL,第一步如何获取PlatformInfo、DeviceInfo

本文主要是介绍非NVIDIA平台下的CUDA的替代方案OpenCL,第一步如何获取PlatformInfo、DeviceInfo,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

非NVIDIA平台下的CUDA的替代方案OpenCL,第一步如何获取PlatformInfo、DeviceInfo

介绍

当谈到高性能计算,NVIDIA的CUDA框架无疑是一个强大的工具。OpenC(Open Computing Language)是一个更为通用的解决方案,或者你使用的是非NVIDIA硬件,那么OpenCL是一个极佳的选择。作为一个开放标准,OpenCL支持广泛的硬件平台,包括CPU、GPU、DSP和FPGA。

OpenCL库API

clGetPlatformIDs

获取平台数量

clGetPlatformInfo

获取平台指定info信息

clGetDeviceIDs

获取设备数量

clGetDeviceInfo

获取设备指定info信息

platform_info定义

CL/cl.h

/* cl_platform_info */
#define CL_PLATFORM_PROFILE                         0x0900
#define CL_PLATFORM_VERSION                         0x0901
#define CL_PLATFORM_NAME                            0x0902
#define CL_PLATFORM_VENDOR                          0x0903
#define CL_PLATFORM_EXTENSIONS                      0x0904
#define CL_PLATFORM_HOST_TIMER_RESOLUTION           0x0905

device_info定义

CL/cl.h

/* cl_device_info */
#define CL_DEVICE_TYPE                                   0x1000
#define CL_DEVICE_VENDOR_ID                              0x1001
#define CL_DEVICE_MAX_COMPUTE_UNITS                      0x1002
#define CL_DEVICE_MAX_WORK_ITEM_DIMENSIONS               0x1003
#define CL_DEVICE_MAX_WORK_GROUP_SIZE                    0x1004
#define CL_DEVICE_MAX_WORK_ITEM_SIZES                    0x1005
#define CL_DEVICE_PREFERRED_VECTOR_WIDTH_CHAR            0x1006
#define CL_DEVICE_PREFERRED_VECTOR_WIDTH_SHORT           0x1007
#define CL_DEVICE_PREFERRED_VECTOR_WIDTH_INT             0x1008
#define CL_DEVICE_PREFERRED_VECTOR_WIDTH_LONG            0x1009
...

测试程序

仓库地址 https://github.com/LitchiCheng/OpenCL-Optimalization-Test

#include <iostream>
#include "string.h"
#include <chrono>#include <CL/cl.h>#define API_NUM 4
cl_platform_info platform_info[API_NUM] = {CL_PLATFORM_PROFILE,CL_PLATFORM_VERSION,CL_PLATFORM_NAME,CL_PLATFORM_VENDOR
};int main(int argc, char const *argv[])
{cl_int status = 0;cl_uint numPlatforms;cl_platform_id platform = NULL;status = clGetPlatformIDs(0, NULL, &numPlatforms);if (status != CL_SUCCESS) {printf("ERROR: Getting Platforms.(clGetPlatformIDs)\n");return EXIT_FAILURE;}printf("\r\n");printf("clGetPlatformIDs num is %d \r\n", numPlatforms);if (numPlatforms > 0) {cl_platform_id *platforms = (cl_platform_id *)malloc(numPlatforms * sizeof(cl_platform_id));status = clGetPlatformIDs(numPlatforms, platforms, NULL);if (status != CL_SUCCESS) {printf("Error: Getting Platform Ids.(clGetPlatformIDs):%d\n", status);return -1;}for (int i = 0; i < numPlatforms; ++i) {for(int index=0; index < API_NUM; ++index){char charbuff[100];status = clGetPlatformInfo(platforms[i],platform_info[index],sizeof(charbuff),charbuff,NULL);platform = platforms[i];printf("clGetPlatformInfo %s \r\n", charbuff);memset(charbuff, 0x00, sizeof(charbuff));}}delete platforms;}cl_uint num_device;cl_device_id device;status = clGetDeviceIDs(platform, CL_DEVICE_TYPE_GPU, 0, NULL, &num_device);printf("GPU num is %d \r\n", num_device);status = clGetDeviceIDs(platform, CL_DEVICE_TYPE_GPU, 1, &device, NULL);if (status != CL_SUCCESS) {printf("Error: clGetDeviceIDs:%d\n", status);return -1;}cl_uint device_max_compute_units;status = clGetDeviceInfo(device, CL_DEVICE_MAX_COMPUTE_UNITS, sizeof(cl_uint),&device_max_compute_units, NULL);if (status != CL_SUCCESS) {printf("Error: CL_DEVICE_MAX_COMPUTE_UNITS:%d\n", status);return -1;}printf("CL_DEVICE_MAX_COMPUTE_UNITS %d \r\n", device_max_compute_units);cl_ulong device_global_mem_size;status = clGetDeviceInfo(device, CL_DEVICE_GLOBAL_MEM_SIZE, sizeof(cl_ulong),&device_global_mem_size, NULL);if (status != CL_SUCCESS) {printf("Error: CL_DEVICE_GLOBAL_MEM_SIZE:%d\n", status);return -1;}printf("CL_DEVICE_GLOBAL_MEM_SIZE %ld \r\n", device_global_mem_size);char device_name[100];status = clGetDeviceInfo(device, CL_DEVICE_NAME, sizeof(device_name),device_name, NULL);if (status != CL_SUCCESS) {printf("Error: CL_DEVICE_NAME:%d\n", status);return -1;}    printf("CL_DEVICE_NAME %s \r\n", device_name);return 0;
}

输出结果

sudo ./getDeviceInfo 
arm_release_ver of this libmali is 'r18p0-01rel0', rk_so_ver is '4'.
clGetPlatformIDs num is 1 
clGetPlatformInfo FULL_PROFILE 
clGetPlatformInfo OpenCL 1.2 v1.r18p0-01rel0.ddd394a39c9049aa64d45a44032b5335 
clGetPlatformInfo ARM Platform 
clGetPlatformInfo ARM 
GPU num is 1 
CL_DEVICE_MAX_COMPUTE_UNITS 4 
CL_DEVICE_GLOBAL_MEM_SIZE 4026908672 
CL_DEVICE_NAME Mali-T860

clinfo对比

在这里插入图片描述

这篇关于非NVIDIA平台下的CUDA的替代方案OpenCL,第一步如何获取PlatformInfo、DeviceInfo的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/865860

相关文章

Java进行文件格式校验的方案详解

《Java进行文件格式校验的方案详解》这篇文章主要为大家详细介绍了Java中进行文件格式校验的相关方案,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、背景异常现象原因排查用户的无心之过二、解决方案Magandroidic Number判断主流检测库对比Tika的使用区分zip

使用Python实现获取网页指定内容

《使用Python实现获取网页指定内容》在当今互联网时代,网页数据抓取是一项非常重要的技能,本文将带你从零开始学习如何使用Python获取网页中的指定内容,希望对大家有所帮助... 目录引言1. 网页抓取的基本概念2. python中的网页抓取库3. 安装必要的库4. 发送HTTP请求并获取网页内容5. 解

IDEA中Git版本回退的两种实现方案

《IDEA中Git版本回退的两种实现方案》作为开发者,代码版本回退是日常高频操作,IntelliJIDEA集成了强大的Git工具链,但面对reset和revert两种核心回退方案,许多开发者仍存在选择... 目录一、版本回退前置知识二、Reset方案:整体改写历史1、IDEA图形化操作(推荐)1.1、查看提

C++常见容器获取头元素的方法大全

《C++常见容器获取头元素的方法大全》在C++编程中,容器是存储和管理数据集合的重要工具,不同的容器提供了不同的接口来访问和操作其中的元素,获取容器的头元素(即第一个元素)是常见的操作之一,本文将详细... 目录一、std::vector二、std::list三、std::deque四、std::forwa

使用Python高效获取网络数据的操作指南

《使用Python高效获取网络数据的操作指南》网络爬虫是一种自动化程序,用于访问和提取网站上的数据,Python是进行网络爬虫开发的理想语言,拥有丰富的库和工具,使得编写和维护爬虫变得简单高效,本文将... 目录网络爬虫的基本概念常用库介绍安装库Requests和BeautifulSoup爬虫开发发送请求解

Python实现html转png的完美方案介绍

《Python实现html转png的完美方案介绍》这篇文章主要为大家详细介绍了如何使用Python实现html转png功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 1.增强稳定性与错误处理建议使用三层异常捕获结构:try: with sync_playwright(

Java使用多线程处理未知任务数的方案介绍

《Java使用多线程处理未知任务数的方案介绍》这篇文章主要为大家详细介绍了Java如何使用多线程实现处理未知任务数,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 知道任务个数,你可以定义好线程数规则,生成线程数去跑代码说明:1.虚拟线程池:使用 Executors.newVir

MySQL中闪回功能的方案讨论及实现

《MySQL中闪回功能的方案讨论及实现》Oracle有一个闪回(flashback)功能,能够用户恢复误操作的数据,这篇文章主要来和大家讨论一下MySQL中支持闪回功能的方案,有需要的可以了解下... 目录1、 闪回的目标2、 无米无炊一3、 无米无炊二4、 演示5、小结oracle有一个闪回(flashb

Android App安装列表获取方法(实践方案)

《AndroidApp安装列表获取方法(实践方案)》文章介绍了Android11及以上版本获取应用列表的方案调整,包括权限配置、白名单配置和action配置三种方式,并提供了相应的Java和Kotl... 目录前言实现方案         方案概述一、 androidManifest 三种配置方式

Python如何获取域名的SSL证书信息和到期时间

《Python如何获取域名的SSL证书信息和到期时间》在当今互联网时代,SSL证书的重要性不言而喻,它不仅为用户提供了安全的连接,还能提高网站的搜索引擎排名,那我们怎么才能通过Python获取域名的S... 目录了解SSL证书的基本概念使用python库来抓取SSL证书信息安装必要的库编写获取SSL证书信息