跟我学C++中级篇——内存屏障内存栅栏和编译器屏障以及相关

2024-05-26 10:12

本文主要是介绍跟我学C++中级篇——内存屏障内存栅栏和编译器屏障以及相关,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、低级同步常见的技术术语

在一些操作系统或者计算机接口等比较原理化的书籍中,经常提到一些低级的同步术语,或者说一些同步的抽象的说法。最典型的就是内存内存屏障。不同的平台和语言有不同的叫法,有的叫内存栅栏或者屏障指令。它的主要作用就是多线程环境下内存访问的顺序性和可见性即实现在某点的中行化操作。
内存屏障有两大类,一般是内存屏障(或者叫CPU屏障)和编译器屏障。
1、CPU内存屏障
这种屏障一般是在CPU运行时防止指令乱序执行的,还记得前面讲过的happen-before吧,不同层次的处理机制而已。CPU内存屏障的另外一个功能是保证数据的可见性。它的意思就是每一次值的改动,都可以保证被所有相关者看到。这种指令一般都涉及到了机器指令,对上层开发者来说,就是汇编指令,常见的有:
mb() 和 smp_mb():用来保证读写有序
wmb() 和 smp_wmb():写有序
rmb() 和 smp_rmb():读有序

2、编译器屏障
编译器屏障就好理解了,就是对编译器的一种约束,让编译器按要求编译。比如在gcc中有一个定义:

#define barrier() __asm__ __volatile__("": : :"memory")

既然按顺序,就涉及到了前面分析的memory_order,可以结合一起学习。

二、不同平台的应用

内存屏障的应用其实主要和硬件的设计有关系。在CPU的设计中,为了提高读写速度,设计了一大把的缓存机制和指令流水,而缓存机制的出现,特别是多级缓存机制的出现,导致了读写操作的复杂性以及数据一致性和完整性的难度。为了解决这些问题,CPU使用写传播和MESI协议(前面的DPDK中也提到过),目的当然是为了实现数据的安全。其实简单的理解就是在某个阶段实现串行化,而串行化,就保障了数据的安全性。
同样,指令流水也会引起一些优化导致指令重排,大家可以看看相关的书籍和资料。
而在开发过程,代码的编写和编译器对指令的翻译以及内存加载后对指令的处理,并非完全一致。这涉及到编译器和CPU对指令优化执行的一个复杂的过程。或者可以这样理解,房屋的设计图纸,在真正实现时,会在各种规章制度下允许的相关优化的再处理,如原设计的布线不安全不免节省材料,水暖走线交叉等等。但这也带来一个问题,在绝大多数情况下,这是一种好的事情。但在某些情况下,可能会导致一些异常的事情发生,比如CAS的ABA问题。
那么解决问题的一种重要方式就是使用内存屏障,告诉编译器,此处代码不需要优化,照方抓药即可。CAS由于不释放CPU一直在循环等待,所以有的老的版本的资料也把它叫做自旋锁。所以说,它叫无锁编程只是一种叫法,在这方面不要纠结。
在不同的语言中根据这种要求,设计出来了各种锁的机制,原理基本都是一致的,可能细节实现上略有不同,只需要看一下,一般都会明白。

三、例程

c++11中提供了一种内存栅栏的同步机制:

// 全局
std::string computation(int);
void print(std::string);std::atomic<int> arr[3] = {-1, -1, -1};
std::string data[1000] // 非原子数据// 线程 A,计算 3 个值
void ThreadA( int v0, int v1, int v2 )
{
//  assert(0 <= v0, v1, v2 < 1000);data[v0] = computation(v0);data[v1] = computation(v1);data[v2] = computation(v2);std::atomic_thread_fence(std::memory_order_release);std::atomic_store_explicit(&arr[0], v0, std::memory_order_relaxed);std::atomic_store_explicit(&arr[1], v1, std::memory_order_relaxed);std::atomic_store_explicit(&arr[2], v2, std::memory_order_relaxed);
}// 线程 B,打印已经计算的 0 与 3 之间的值。
void ThreadB()
{int v0 = std::atomic_load_explicit(&arr[0], std::memory_order_relaxed);int v1 = std::atomic_load_explicit(&arr[1], std::memory_order_relaxed);int v2 = std::atomic_load_explicit(&arr[2], std::memory_order_relaxed);std::atomic_thread_fence(std::memory_order_acquire);
//  v0、v1、v2 可能全部或部分结果为 -1。
//  其他情况下读取非原子数据是安全的,因为栅栏:if (v0 != -1)print(data[v0]);if (v1 != -1)print(data[v1]);if (v2 != -1)print(data[v2]);
}

内存栅栏std::atomic_thread_fence与各种锁及同步机制可以达到相同的目的。但二者的不同在于,前者一般用于在无锁编程中,而后者一般用在有锁编程中。

四、总结

有锁和无锁就如武学上的有剑和无剑,重要的不是剑,是一种对内存原理的根本性的理解。不要对一些技术奉为圭臬,因为每一种技术一定有它的长处和短处。也就是常说的应用场景,只有会灵活运用,才是自由的编程。

这篇关于跟我学C++中级篇——内存屏障内存栅栏和编译器屏障以及相关的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1004174

相关文章

Java循环创建对象内存溢出的解决方法

《Java循环创建对象内存溢出的解决方法》在Java中,如果在循环中不当地创建大量对象而不及时释放内存,很容易导致内存溢出(OutOfMemoryError),所以本文给大家介绍了Java循环创建对象... 目录问题1. 解决方案2. 示例代码2.1 原始版本(可能导致内存溢出)2.2 修改后的版本问题在

大数据小内存排序问题如何巧妙解决

《大数据小内存排序问题如何巧妙解决》文章介绍了大数据小内存排序的三种方法:数据库排序、分治法和位图法,数据库排序简单但速度慢,对设备要求高;分治法高效但实现复杂;位图法可读性差,但存储空间受限... 目录三种方法:方法概要数据库排序(http://www.chinasem.cn对数据库设备要求较高)分治法(常

Redis多种内存淘汰策略及配置技巧分享

《Redis多种内存淘汰策略及配置技巧分享》本文介绍了Redis内存满时的淘汰机制,包括内存淘汰机制的概念,Redis提供的8种淘汰策略(如noeviction、volatile-lru等)及其适用场... 目录前言一、什么是 Redis 的内存淘汰机制?二、Redis 内存淘汰策略1. pythonnoe

Linux使用fdisk进行磁盘的相关操作

《Linux使用fdisk进行磁盘的相关操作》fdisk命令是Linux中用于管理磁盘分区的强大文本实用程序,这篇文章主要为大家详细介绍了如何使用fdisk进行磁盘的相关操作,需要的可以了解下... 目录简介基本语法示例用法列出所有分区查看指定磁盘的区分管理指定的磁盘进入交互式模式创建一个新的分区删除一个存

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

关于Maven生命周期相关命令演示

《关于Maven生命周期相关命令演示》Maven的生命周期分为Clean、Default和Site三个主要阶段,每个阶段包含多个关键步骤,如清理、编译、测试、打包等,通过执行相应的Maven命令,可以... 目录1. Maven 生命周期概述1.1 Clean Lifecycle1.2 Default Li

numpy求解线性代数相关问题

《numpy求解线性代数相关问题》本文主要介绍了numpy求解线性代数相关问题,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 在numpy中有numpy.array类型和numpy.mat类型,前者是数组类型,后者是矩阵类型。数组

C++中实现调试日志输出

《C++中实现调试日志输出》在C++编程中,调试日志对于定位问题和优化代码至关重要,本文将介绍几种常用的调试日志输出方法,并教你如何在日志中添加时间戳,希望对大家有所帮助... 目录1. 使用 #ifdef _DEBUG 宏2. 加入时间戳:精确到毫秒3.Windows 和 MFC 中的调试日志方法MFC

深入理解C++ 空类大小

《深入理解C++空类大小》本文主要介绍了C++空类大小,规定空类大小为1字节,主要是为了保证对象的唯一性和可区分性,满足数组元素地址连续的要求,下面就来了解一下... 目录1. 保证对象的唯一性和可区分性2. 满足数组元素地址连续的要求3. 与C++的对象模型和内存管理机制相适配查看类对象内存在C++中,规

关于Java内存访问重排序的研究

《关于Java内存访问重排序的研究》文章主要介绍了重排序现象及其在多线程编程中的影响,包括内存可见性问题和Java内存模型中对重排序的规则... 目录什么是重排序重排序图解重排序实验as-if-serial语义内存访问重排序与内存可见性内存访问重排序与Java内存模型重排序示意表内存屏障内存屏障示意表Int