跟我学C++中级篇——内存屏障内存栅栏和编译器屏障以及相关

2024-05-26 10:12

本文主要是介绍跟我学C++中级篇——内存屏障内存栅栏和编译器屏障以及相关,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、低级同步常见的技术术语

在一些操作系统或者计算机接口等比较原理化的书籍中,经常提到一些低级的同步术语,或者说一些同步的抽象的说法。最典型的就是内存内存屏障。不同的平台和语言有不同的叫法,有的叫内存栅栏或者屏障指令。它的主要作用就是多线程环境下内存访问的顺序性和可见性即实现在某点的中行化操作。
内存屏障有两大类,一般是内存屏障(或者叫CPU屏障)和编译器屏障。
1、CPU内存屏障
这种屏障一般是在CPU运行时防止指令乱序执行的,还记得前面讲过的happen-before吧,不同层次的处理机制而已。CPU内存屏障的另外一个功能是保证数据的可见性。它的意思就是每一次值的改动,都可以保证被所有相关者看到。这种指令一般都涉及到了机器指令,对上层开发者来说,就是汇编指令,常见的有:
mb() 和 smp_mb():用来保证读写有序
wmb() 和 smp_wmb():写有序
rmb() 和 smp_rmb():读有序

2、编译器屏障
编译器屏障就好理解了,就是对编译器的一种约束,让编译器按要求编译。比如在gcc中有一个定义:

#define barrier() __asm__ __volatile__("": : :"memory")

既然按顺序,就涉及到了前面分析的memory_order,可以结合一起学习。

二、不同平台的应用

内存屏障的应用其实主要和硬件的设计有关系。在CPU的设计中,为了提高读写速度,设计了一大把的缓存机制和指令流水,而缓存机制的出现,特别是多级缓存机制的出现,导致了读写操作的复杂性以及数据一致性和完整性的难度。为了解决这些问题,CPU使用写传播和MESI协议(前面的DPDK中也提到过),目的当然是为了实现数据的安全。其实简单的理解就是在某个阶段实现串行化,而串行化,就保障了数据的安全性。
同样,指令流水也会引起一些优化导致指令重排,大家可以看看相关的书籍和资料。
而在开发过程,代码的编写和编译器对指令的翻译以及内存加载后对指令的处理,并非完全一致。这涉及到编译器和CPU对指令优化执行的一个复杂的过程。或者可以这样理解,房屋的设计图纸,在真正实现时,会在各种规章制度下允许的相关优化的再处理,如原设计的布线不安全不免节省材料,水暖走线交叉等等。但这也带来一个问题,在绝大多数情况下,这是一种好的事情。但在某些情况下,可能会导致一些异常的事情发生,比如CAS的ABA问题。
那么解决问题的一种重要方式就是使用内存屏障,告诉编译器,此处代码不需要优化,照方抓药即可。CAS由于不释放CPU一直在循环等待,所以有的老的版本的资料也把它叫做自旋锁。所以说,它叫无锁编程只是一种叫法,在这方面不要纠结。
在不同的语言中根据这种要求,设计出来了各种锁的机制,原理基本都是一致的,可能细节实现上略有不同,只需要看一下,一般都会明白。

三、例程

c++11中提供了一种内存栅栏的同步机制:

// 全局
std::string computation(int);
void print(std::string);std::atomic<int> arr[3] = {-1, -1, -1};
std::string data[1000] // 非原子数据// 线程 A,计算 3 个值
void ThreadA( int v0, int v1, int v2 )
{
//  assert(0 <= v0, v1, v2 < 1000);data[v0] = computation(v0);data[v1] = computation(v1);data[v2] = computation(v2);std::atomic_thread_fence(std::memory_order_release);std::atomic_store_explicit(&arr[0], v0, std::memory_order_relaxed);std::atomic_store_explicit(&arr[1], v1, std::memory_order_relaxed);std::atomic_store_explicit(&arr[2], v2, std::memory_order_relaxed);
}// 线程 B,打印已经计算的 0 与 3 之间的值。
void ThreadB()
{int v0 = std::atomic_load_explicit(&arr[0], std::memory_order_relaxed);int v1 = std::atomic_load_explicit(&arr[1], std::memory_order_relaxed);int v2 = std::atomic_load_explicit(&arr[2], std::memory_order_relaxed);std::atomic_thread_fence(std::memory_order_acquire);
//  v0、v1、v2 可能全部或部分结果为 -1。
//  其他情况下读取非原子数据是安全的,因为栅栏:if (v0 != -1)print(data[v0]);if (v1 != -1)print(data[v1]);if (v2 != -1)print(data[v2]);
}

内存栅栏std::atomic_thread_fence与各种锁及同步机制可以达到相同的目的。但二者的不同在于,前者一般用于在无锁编程中,而后者一般用在有锁编程中。

四、总结

有锁和无锁就如武学上的有剑和无剑,重要的不是剑,是一种对内存原理的根本性的理解。不要对一些技术奉为圭臬,因为每一种技术一定有它的长处和短处。也就是常说的应用场景,只有会灵活运用,才是自由的编程。

这篇关于跟我学C++中级篇——内存屏障内存栅栏和编译器屏障以及相关的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1004174

相关文章

C++一个数组赋值给另一个数组方式

《C++一个数组赋值给另一个数组方式》文章介绍了三种在C++中将一个数组赋值给另一个数组的方法:使用循环逐个元素赋值、使用标准库函数std::copy或std::memcpy以及使用标准库容器,每种方... 目录C++一个数组赋值给另一个数组循环遍历赋值使用标准库中的函数 std::copy 或 std::

C++使用栈实现括号匹配的代码详解

《C++使用栈实现括号匹配的代码详解》在编程中,括号匹配是一个常见问题,尤其是在处理数学表达式、编译器解析等任务时,栈是一种非常适合处理此类问题的数据结构,能够精确地管理括号的匹配问题,本文将通过C+... 目录引言问题描述代码讲解代码解析栈的状态表示测试总结引言在编程中,括号匹配是一个常见问题,尤其是在

使用C++实现链表元素的反转

《使用C++实现链表元素的反转》反转链表是链表操作中一个经典的问题,也是面试中常见的考题,本文将从思路到实现一步步地讲解如何实现链表的反转,帮助初学者理解这一操作,我们将使用C++代码演示具体实现,同... 目录问题定义思路分析代码实现带头节点的链表代码讲解其他实现方式时间和空间复杂度分析总结问题定义给定

C++初始化数组的几种常见方法(简单易懂)

《C++初始化数组的几种常见方法(简单易懂)》本文介绍了C++中数组的初始化方法,包括一维数组和二维数组的初始化,以及用new动态初始化数组,在C++11及以上版本中,还提供了使用std::array... 目录1、初始化一维数组1.1、使用列表初始化(推荐方式)1.2、初始化部分列表1.3、使用std::

C++ Primer 多维数组的使用

《C++Primer多维数组的使用》本文主要介绍了多维数组在C++语言中的定义、初始化、下标引用以及使用范围for语句处理多维数组的方法,具有一定的参考价值,感兴趣的可以了解一下... 目录多维数组多维数组的初始化多维数组的下标引用使用范围for语句处理多维数组指针和多维数组多维数组严格来说,C++语言没

golang内存对齐的项目实践

《golang内存对齐的项目实践》本文主要介绍了golang内存对齐的项目实践,内存对齐不仅有助于提高内存访问效率,还确保了与硬件接口的兼容性,是Go语言编程中不可忽视的重要优化手段,下面就来介绍一下... 目录一、结构体中的字段顺序与内存对齐二、内存对齐的原理与规则三、调整结构体字段顺序优化内存对齐四、内

c++中std::placeholders的使用方法

《c++中std::placeholders的使用方法》std::placeholders是C++标准库中的一个工具,用于在函数对象绑定时创建占位符,本文就来详细的介绍一下,具有一定的参考价值,感兴... 目录1. 基本概念2. 使用场景3. 示例示例 1:部分参数绑定示例 2:参数重排序4. 注意事项5.

使用C++将处理后的信号保存为PNG和TIFF格式

《使用C++将处理后的信号保存为PNG和TIFF格式》在信号处理领域,我们常常需要将处理结果以图像的形式保存下来,方便后续分析和展示,C++提供了多种库来处理图像数据,本文将介绍如何使用stb_ima... 目录1. PNG格式保存使用stb_imagephp_write库1.1 安装和包含库1.2 代码解

C++实现封装的顺序表的操作与实践

《C++实现封装的顺序表的操作与实践》在程序设计中,顺序表是一种常见的线性数据结构,通常用于存储具有固定顺序的元素,与链表不同,顺序表中的元素是连续存储的,因此访问速度较快,但插入和删除操作的效率可能... 目录一、顺序表的基本概念二、顺序表类的设计1. 顺序表类的成员变量2. 构造函数和析构函数三、顺序表

使用C++实现单链表的操作与实践

《使用C++实现单链表的操作与实践》在程序设计中,链表是一种常见的数据结构,特别是在动态数据管理、频繁插入和删除元素的场景中,链表相比于数组,具有更高的灵活性和高效性,尤其是在需要频繁修改数据结构的应... 目录一、单链表的基本概念二、单链表类的设计1. 节点的定义2. 链表的类定义三、单链表的操作实现四、