跟我学C++中级篇——内存屏障内存栅栏和编译器屏障以及相关

2024-05-26 10:12

本文主要是介绍跟我学C++中级篇——内存屏障内存栅栏和编译器屏障以及相关,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、低级同步常见的技术术语

在一些操作系统或者计算机接口等比较原理化的书籍中,经常提到一些低级的同步术语,或者说一些同步的抽象的说法。最典型的就是内存内存屏障。不同的平台和语言有不同的叫法,有的叫内存栅栏或者屏障指令。它的主要作用就是多线程环境下内存访问的顺序性和可见性即实现在某点的中行化操作。
内存屏障有两大类,一般是内存屏障(或者叫CPU屏障)和编译器屏障。
1、CPU内存屏障
这种屏障一般是在CPU运行时防止指令乱序执行的,还记得前面讲过的happen-before吧,不同层次的处理机制而已。CPU内存屏障的另外一个功能是保证数据的可见性。它的意思就是每一次值的改动,都可以保证被所有相关者看到。这种指令一般都涉及到了机器指令,对上层开发者来说,就是汇编指令,常见的有:
mb() 和 smp_mb():用来保证读写有序
wmb() 和 smp_wmb():写有序
rmb() 和 smp_rmb():读有序

2、编译器屏障
编译器屏障就好理解了,就是对编译器的一种约束,让编译器按要求编译。比如在gcc中有一个定义:

#define barrier() __asm__ __volatile__("": : :"memory")

既然按顺序,就涉及到了前面分析的memory_order,可以结合一起学习。

二、不同平台的应用

内存屏障的应用其实主要和硬件的设计有关系。在CPU的设计中,为了提高读写速度,设计了一大把的缓存机制和指令流水,而缓存机制的出现,特别是多级缓存机制的出现,导致了读写操作的复杂性以及数据一致性和完整性的难度。为了解决这些问题,CPU使用写传播和MESI协议(前面的DPDK中也提到过),目的当然是为了实现数据的安全。其实简单的理解就是在某个阶段实现串行化,而串行化,就保障了数据的安全性。
同样,指令流水也会引起一些优化导致指令重排,大家可以看看相关的书籍和资料。
而在开发过程,代码的编写和编译器对指令的翻译以及内存加载后对指令的处理,并非完全一致。这涉及到编译器和CPU对指令优化执行的一个复杂的过程。或者可以这样理解,房屋的设计图纸,在真正实现时,会在各种规章制度下允许的相关优化的再处理,如原设计的布线不安全不免节省材料,水暖走线交叉等等。但这也带来一个问题,在绝大多数情况下,这是一种好的事情。但在某些情况下,可能会导致一些异常的事情发生,比如CAS的ABA问题。
那么解决问题的一种重要方式就是使用内存屏障,告诉编译器,此处代码不需要优化,照方抓药即可。CAS由于不释放CPU一直在循环等待,所以有的老的版本的资料也把它叫做自旋锁。所以说,它叫无锁编程只是一种叫法,在这方面不要纠结。
在不同的语言中根据这种要求,设计出来了各种锁的机制,原理基本都是一致的,可能细节实现上略有不同,只需要看一下,一般都会明白。

三、例程

c++11中提供了一种内存栅栏的同步机制:

// 全局
std::string computation(int);
void print(std::string);std::atomic<int> arr[3] = {-1, -1, -1};
std::string data[1000] // 非原子数据// 线程 A,计算 3 个值
void ThreadA( int v0, int v1, int v2 )
{
//  assert(0 <= v0, v1, v2 < 1000);data[v0] = computation(v0);data[v1] = computation(v1);data[v2] = computation(v2);std::atomic_thread_fence(std::memory_order_release);std::atomic_store_explicit(&arr[0], v0, std::memory_order_relaxed);std::atomic_store_explicit(&arr[1], v1, std::memory_order_relaxed);std::atomic_store_explicit(&arr[2], v2, std::memory_order_relaxed);
}// 线程 B,打印已经计算的 0 与 3 之间的值。
void ThreadB()
{int v0 = std::atomic_load_explicit(&arr[0], std::memory_order_relaxed);int v1 = std::atomic_load_explicit(&arr[1], std::memory_order_relaxed);int v2 = std::atomic_load_explicit(&arr[2], std::memory_order_relaxed);std::atomic_thread_fence(std::memory_order_acquire);
//  v0、v1、v2 可能全部或部分结果为 -1。
//  其他情况下读取非原子数据是安全的,因为栅栏:if (v0 != -1)print(data[v0]);if (v1 != -1)print(data[v1]);if (v2 != -1)print(data[v2]);
}

内存栅栏std::atomic_thread_fence与各种锁及同步机制可以达到相同的目的。但二者的不同在于,前者一般用于在无锁编程中,而后者一般用在有锁编程中。

四、总结

有锁和无锁就如武学上的有剑和无剑,重要的不是剑,是一种对内存原理的根本性的理解。不要对一些技术奉为圭臬,因为每一种技术一定有它的长处和短处。也就是常说的应用场景,只有会灵活运用,才是自由的编程。

这篇关于跟我学C++中级篇——内存屏障内存栅栏和编译器屏障以及相关的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1004174

相关文章

Python如何使用__slots__实现节省内存和性能优化

《Python如何使用__slots__实现节省内存和性能优化》你有想过,一个小小的__slots__能让你的Python类内存消耗直接减半吗,没错,今天咱们要聊的就是这个让人眼前一亮的技巧,感兴趣的... 目录背景:内存吃得满满的类__slots__:你的内存管理小助手举个大概的例子:看看效果如何?1.

C++ 中的 if-constexpr语法和作用

《C++中的if-constexpr语法和作用》if-constexpr语法是C++17引入的新语法特性,也被称为常量if表达式或静态if(staticif),:本文主要介绍C++中的if-c... 目录1 if-constexpr 语法1.1 基本语法1.2 扩展说明1.2.1 条件表达式1.2.2 fa

JavaScript Array.from及其相关用法详解(示例演示)

《JavaScriptArray.from及其相关用法详解(示例演示)》Array.from方法是ES6引入的一个静态方法,用于从类数组对象或可迭代对象创建一个新的数组实例,本文将详细介绍Array... 目录一、Array.from 方法概述1. 方法介绍2. 示例演示二、结合实际场景的使用1. 初始化二

C++中::SHCreateDirectoryEx函数使用方法

《C++中::SHCreateDirectoryEx函数使用方法》::SHCreateDirectoryEx用于创建多级目录,类似于mkdir-p命令,本文主要介绍了C++中::SHCreateDir... 目录1. 函数原型与依赖项2. 基本使用示例示例 1:创建单层目录示例 2:创建多级目录3. 关键注

C++从序列容器中删除元素的四种方法

《C++从序列容器中删除元素的四种方法》删除元素的方法在序列容器和关联容器之间是非常不同的,在序列容器中,vector和string是最常用的,但这里也会介绍deque和list以供全面了解,尽管在一... 目录一、简介二、移除给定位置的元素三、移除与某个值相等的元素3.1、序列容器vector、deque

C++常见容器获取头元素的方法大全

《C++常见容器获取头元素的方法大全》在C++编程中,容器是存储和管理数据集合的重要工具,不同的容器提供了不同的接口来访问和操作其中的元素,获取容器的头元素(即第一个元素)是常见的操作之一,本文将详细... 目录一、std::vector二、std::list三、std::deque四、std::forwa

C++字符串提取和分割的多种方法

《C++字符串提取和分割的多种方法》在C++编程中,字符串处理是一个常见的任务,尤其是在需要从字符串中提取特定数据时,本文将详细探讨如何使用C++标准库中的工具来提取和分割字符串,并分析不同方法的适用... 目录1. 字符串提取的基本方法1.1 使用 std::istringstream 和 >> 操作符示

C++原地删除有序数组重复项的N种方法

《C++原地删除有序数组重复项的N种方法》给定一个排序数组,你需要在原地删除重复出现的元素,使得每个元素只出现一次,返回移除后数组的新长度,不要使用额外的数组空间,你必须在原地修改输入数组并在使用O(... 目录一、问题二、问题分析三、算法实现四、问题变体:最多保留两次五、分析和代码实现5.1、问题分析5.

C++ 各种map特点对比分析

《C++各种map特点对比分析》文章比较了C++中不同类型的map(如std::map,std::unordered_map,std::multimap,std::unordered_multima... 目录特点比较C++ 示例代码 ​​​​​​代码解释特点比较1. std::map底层实现:基于红黑

C++中函数模板与类模板的简单使用及区别介绍

《C++中函数模板与类模板的简单使用及区别介绍》这篇文章介绍了C++中的模板机制,包括函数模板和类模板的概念、语法和实际应用,函数模板通过类型参数实现泛型操作,而类模板允许创建可处理多种数据类型的类,... 目录一、函数模板定义语法真实示例二、类模板三、关键区别四、注意事项 ‌在C++中,模板是实现泛型编程