NEON + OpenMP测试

2024-06-20 07:58
文章标签 测试 neon openmp

本文主要是介绍NEON + OpenMP测试,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在嵌入式的开发中,一直有在使用OpenMP和NEON加速,这次对二者的加速效果做了一个对比,包括二者的组合效果,因为只测试了加法的情况,其他的运行逻辑需要再实际使用中评估。

具体的测试代码如下:

#include <QCoreApplication>
#include <omp.h>
#include <arm_neon.h>
#include <QTime>
#include <QDebug>int test(uint n)
{uint sum = 0;for(uint i=0;i<n;++i){sum+=1;}return sum;
}uint testNeon(uint n)
{uint sum = 0;uint array[10000];for(uint i=0;i<10000;i++){array[i]=1;}uint32x4_t in1,in2;in1 = vld1q_u32(array);for(uint j=0;j<100;j++){uint i=0;if(j==0)i=1;for(;i<(10000/4);++i){uint * temp = (array+4*i);in2 = vld1q_u32(temp);in1 = vaddq_u32(in1,in2);}}sum = vaddvq_u32(in1);return sum;
}int main(int argc, char *argv[])
{QCoreApplication a(argc, argv);uint n = 1000000,sum=0;qDebug("********NO ACC TEST********");QTime timer = QTime::currentTime();for(int i =0;i<1000;i++){sum+=test(n);}qDebug("NO ACC TEST COST: %d ms, sum=%d",timer.msecsTo(QTime::currentTime()),sum);sum=0;qDebug("********OpenMP(2) TEST********");timer = QTime::currentTime();#pragma omp parallel for reduction(+:sum) num_threads(2)for(int i =0;i<1000;i++){sum+=test(n);}qDebug("OpenMP(2) TEST COST: %d ms, sum=%d",timer.msecsTo(QTime::currentTime()),sum);sum=0;qDebug("********OpenMP(4) TEST********");timer = QTime::currentTime();#pragma omp parallel for reduction(+:sum) num_threads(4)for(int i =0;i<1000;i++){sum+=test(n);}qDebug("OpenMP(4) TEST COST: %d ms, sum=%d",timer.msecsTo(QTime::currentTime()),sum);sum=0;qDebug("********NEON TEST********");timer = QTime::currentTime();for(int i =0;i<1000;i++){sum+=testNeon(n);}qDebug("NEON TEST COST: %d ms, sum=%d",timer.msecsTo(QTime::currentTime()),sum);sum=0;qDebug("********NEON+OpenMP(2) TEST********");timer = QTime::currentTime();#pragma omp parallel for reduction(+:sum) num_threads(2)for(int i =0;i<1000;i++){sum+=testNeon(n);}qDebug("NEON+openmp(2) COST: %d ms, sum=%d",timer.msecsTo(QTime::currentTime()),sum);sum=0;qDebug("********NEON+openmp(4) TEST********");timer = QTime::currentTime();#pragma omp parallel for reduction(+:sum) num_threads(4)for(int i =0;i<1000;i++){sum+=testNeon(n);}qDebug("NEON+openmp(4) TEST COST: %d ms, sum=%d",timer.msecsTo(QTime::currentTime()),sum);return a.exec();
}

最终的运行结果如下:

********NO ACC TEST********
NO ACC TEST COST: 1171 ms, sum=1000000000
********OpenMP(2) TEST********
OpenMP(2) TEST COST: 560 ms, sum=1000000000
********OpenMP(4) TEST********
OpenMP(4) TEST COST: 437 ms, sum=1000000000
********NEON TEST********
NEON TEST COST: 489 ms, sum=1000000000
********NEON+OpenMP(2) TEST********
NEON+openmp(2) COST: 222 ms, sum=1000000000
********NEON+openmp(4) TEST********
NEON+openmp(4) TEST COST: 205 ms, sum=1000000000
测试结果

加速

方式

NOOpenMP(2)OpenMP(4)NEON

NEON +

OpenMP(2)

NEON +

OPENMP(4)

结果正确正确正确正确正确正确
时间1171560437489222205

可以看到同时使用两者的方式,加速效果最好,但是当OpenMP使用的核数增多时,加速效果降低。在并行计算量比较小的时候,有限使用NEON加速。

这篇关于NEON + OpenMP测试的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1077551

相关文章

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

字节面试 | 如何测试RocketMQ、RocketMQ?

字节面试:RocketMQ是怎么测试的呢? 答: 首先保证消息的消费正确、设计逆向用例,在验证消息内容为空等情况时的消费正确性; 推送大批量MQ,通过Admin控制台查看MQ消费的情况,是否出现消费假死、TPS是否正常等等问题。(上述都是临场发挥,但是RocketMQ真正的测试点,还真的需要探讨) 01 先了解RocketMQ 作为测试也是要简单了解RocketMQ。简单来说,就是一个分

【测试】输入正确用户名和密码,点击登录没有响应的可能性原因

目录 一、前端问题 1. 界面交互问题 2. 输入数据校验问题 二、网络问题 1. 网络连接中断 2. 代理设置问题 三、后端问题 1. 服务器故障 2. 数据库问题 3. 权限问题: 四、其他问题 1. 缓存问题 2. 第三方服务问题 3. 配置问题 一、前端问题 1. 界面交互问题 登录按钮的点击事件未正确绑定,导致点击后无法触发登录操作。 页面可能存在

业务中14个需要进行A/B测试的时刻[信息图]

在本指南中,我们将全面了解有关 A/B测试 的所有内容。 我们将介绍不同类型的A/B测试,如何有效地规划和启动测试,如何评估测试是否成功,您应该关注哪些指标,多年来我们发现的常见错误等等。 什么是A/B测试? A/B测试(有时称为“分割测试”)是一种实验类型,其中您创建两种或多种内容变体——如登录页面、电子邮件或广告——并将它们显示给不同的受众群体,以查看哪一种效果最好。 本质上,A/B测

Verybot之OpenCV应用一:安装与图像采集测试

在Verybot上安装OpenCV是很简单的,只需要执行:         sudo apt-get update         sudo apt-get install libopencv-dev         sudo apt-get install python-opencv         下面就对安装好的OpenCV进行一下测试,编写一个通过USB摄像头采

BIRT 报表的自动化测试

来源:http://www.ibm.com/developerworks/cn/opensource/os-cn-ecl-birttest/如何为 BIRT 报表编写自动化测试用例 BIRT 是一项很受欢迎的报表制作工具,但目前对其的测试还是以人工测试为主。本文介绍了如何对 BIRT 报表进行自动化测试,以及在实际项目中的一些测试实践,从而提高了测试的效率和准确性 -------

可测试,可维护,可移植:上位机软件分层设计的重要性

互联网中,软件工程师岗位会分前端工程师,后端工程师。这是由于互联网软件规模庞大,从业人员众多。前后端分别根据各自需求发展不一样的技术栈。那么上位机软件呢?它规模小,通常一个人就能开发一个项目。它还有必要分前后端吗? 有必要。本文从三个方面论述。分别是可测试,可维护,可移植。 可测试 软件黑盒测试更普遍,但很难覆盖所有应用场景。于是有了接口测试、模块化测试以及单元测试。都是通过降低测试对象

day45-测试平台搭建之前端vue学习-基础4

目录 一、生命周期         1.1.概念         1.2.常用的生命周期钩子         1.3.关于销毁Vue实例         1.4.原理​编辑         1.5.代码 二、非单文件组件         2.1.组件         2.2.使用组件的三大步骤         2.3.注意点         2.4.关于VueComponen

如何成为一个优秀的测试工程师

链接地址:http://blog.csdn.net/KerryZhu/article/details/5250504 我一直在想,如何将自己的测试团队打造成世界一流的团队?流程、测试自动化、创新、扁平式管理、国际标准制定、测试社区贡献、…… 但首先一点是明确的,就是要将每一个测试工程师打造成优秀的测试工程师,优秀的团队必须由优秀的成员构成。所以,先讨论“如何成为一个优秀的测试工程师”,

python自动化测试框架--RobotFramework

为什么需要测试框架 在测试中,经常会为了怎样做测试、使用什么测试工具、如何使用、为什么使用测试工具、使用测试工具能帮助到我们什么等等问题而纠结。当我们选择一项测试工具时,如何组织大量自动化用例;如何合理的进行初始化清除;如何批量筛选待执行的用例;如何输出清晰的测试报告,就是需要我们考虑的事情了。下面简单介绍个使用比较广泛的自动化测试框架,即Robotframework。 RF的特点 RF:由pyt