本文主要是介绍OpenMP并行加速,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
OpenMP并行加速
1. 简介
OpenMP是一个编译器指令和库函数集合,主要是为共享式存储计算机并行程序设计使用的。
OpenMP的一个Parallelfor指令,就是标准的并行模式fork/join式并行模式,基本思想是,程序开始时只有一个主线程,程序中的串行部分都由主线程执行,并行的部分是通过派生其他线程来执行,但是如果并行部分没有结束时是不会执行串行部分的。也即OpenMP并行执行的程序要全部结束后才能执行后面的非并行部分。
2. 调用形式:#pragma omp 指令 【子句【子句】…】
①#pragma omp parallel
{
每个线程都会执行大括号里的代码,线程id号不确定
}
带有for语句:将for循环拆分开来尽可能平均地分配到各个线程执行,要求数据不存在依赖。
1)#pragma omp parallel for
for()
作用域只是紧跟着的那个for循环,紧跟着的for变成并行,要求里面的循环互不干扰。
#pragma ompparallel for
for (int i = 0; i < 6; i++)
printf("i = %d, I amThread %d\n", i, omp_get_thread_num());
//这里是两个for循环之间的代码,将会由线程0即主线程执行
printf("I am Thread %d\n", omp_get_thread_num());
#pragma ompparallel for
for (int i = 0; i < 6; i++)
printf("i = %d, I amThread %d\n", i, omp_get_thread_num());
注意:两个for循环之间有一些代码只能有一个线程执行
2)#pragma omp parallel
{ //注意:大括号必须要另起一行
#pragma omp for
for()
}
整个并行块中可以出现多个for指令
#pragma ompparallel
{
#pragma omp for
for (int i = 0; i < 6;i++)
printf("i = %d,I am Thread %d\n", i, omp_get_thread_num());
#pragma omp master
{
//这里的代码由主线程执行,改成single是随机选一个线程执行
printf("I amThread %d\n", omp_get_thread_num());
这篇关于OpenMP并行加速的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!