C语言的本质(四):volatile限定符

2023-10-20 09:50

本文主要是介绍C语言的本质(四):volatile限定符,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

本节探讨一下编译器优化会对生成的指令产生什么影响,在此基础上介绍C语言的volatile限定符。首先看下面的例子。

volatile限定符

      /* artificial device registers */unsigned char recv;unsigned char send;/* memory buffer */unsigned char buf[3];int main(void){buf[0] = recv;buf[1] = recv;buf[2] = recv;send = ~buf[0];send = ~buf[1];send = ~buf[2];return 0;}

我们用recv和send这两个全局变量来模拟设备寄存器。

假设某种平台采用内存映射I/O,串口发送寄存器和串口接收寄存器位于固定的内存地址,而recv和send这两个全局变量也有固定的内存地址,所以在这个例子中把它们假想成串口接收寄存器和串口发送寄存器。

在main函数中,首先从串口接收三个字节存到buf数组,然后把这三个字节取反,依次从串口发送出去。

我们查看这段代码的反汇编结果:

            buf[0] = recv;80483b7:      0f b6 05 19 a0 04 08     movzbl 0x804a019,%eax80483be:      a2 1a a0 04 08           mov   %al,0x804a01abuf[1] = recv;80483c3:      0f b6 05 19 a0 04 08     movzbl 0x804a019,%eax80483ca:      a2 1b a0 04 08           mov   %al,0x804a01bbuf[2] = recv;80483cf:      0f b6 05 19 a0 04 08     movzbl 0x804a019,%eax80483d6:      a2 1c a0 04 08           mov   %al,0x804a01csend = ~buf[0];80483db:      0f b6 05 1a a0 04 08     movzbl 0x804a01a,%eax80483e2:      f7 d0                 not   %eax80483e4:      a2 18 a0 04 08           mov   %al,0x804a018send = ~buf[1];80483e9:      0f b6 05 1b a0 04 08     movzbl 0x804a01b,%eax80483f0:      f7 d0                 not   %eax80483f2:      a2 18 a0 04 08            mov   %al,0x804a018send = ~buf[2];80483f7:      0f b6 05 1c a0 04 08     movzbl 0x804a01c,%eax80483fe:      f7 d0                 not   %eax8048400:      a2 18 a0 04 08           mov   %al,0x804a018

movz指令把字长较短的值存到字长较长的存储单元中,存储单元的高位用0填充。

该指令可以有b(byte)、w(word)、l(long)三种后缀,分别表示单字节、两字节和四字节

比如movzbl 0x804a019,%eax表示把地址0x804a019处的一个字节存到eax寄存器中,而eax寄存器的长度是4个字节,高3个字节用0填充,如果高3个字节采用符号扩展则应该用movsbl指令,z表示zero而s表示sign。

下一条指令mov %al,0x804a01a中的al寄存器正是eax寄存器的低字节,这条指令把eax寄存器的低字节存到地址0x804a01a处的一个字节中。

可以用不同的名字单独访问x86寄存器的低8位、次低8位、低16位或者完整的32位,以eax为例,al表示低8位,ah表示次低8位,ax表示低16位,如图18.7所示。

在这里插入图片描述

如果指定优化选项-O编译,反汇编的结果就不一样了:

      $ gcc main.c -g -O$ objdump -dS a.out|less...buf[0] = recv;80483b7:      0f b6 05 19 a0 04 08   movzbl 0x804a019,%eax80483be:      a2 1a a0 04 08         mov   %al,0x804a01abuf[1] = recv;80483c3:      a2 1b a0 04 08         mov   %al,0x804a01bbuf[2] = recv;80483c8:      a2 1c a0 04 08         mov   %al,0x804a01csend = ~buf[0];send = ~buf[1];send = ~buf[2];80483cd:      f7 d0                  not   %eax80483cf:      a2 18 a0 04 08         mov   %al,0x804a018...

前三条语句从串口接收三个字节,而编译生成的指令显然不符合我们的意图:只有第一条语句从内存地址0x804a019读一个字节到寄存器eax中,然后从寄存器al保存到buf[0],后两条语句就不再从内存地址0x804a019读取,而是直接把寄存器al的值保存到buf[1]和buf[2]。

后三条语句把buf中的三个字节取反再发送到串口,编译生成的指令也不符合我们的意图:只有最后一条语句把eax取反然后写到内存地址0x804a018了,前两条语句形同虚设,根本不生成指令。

为什么编译器优化的结果会错呢?因为编译器并不知道0x804a018和0x804a019是设备寄存器的地址,把它们当成普通的内存单元了。

如果是普通的内存单元,只要程序不去改写它,它就不会变,可以先把内存单元里的值读到寄存器缓存起来,以后每次用到这个值就直接从寄存器读取,这样效率更高,我们知道读寄存器远比读内存要快。

另一方面,如果对一个普通的内存单元连续做三次写操作,只有最后一次的值会保存到内存单元中,所以前两次写操作是多余的,可以优化掉。

然而访问设备寄存器的代码这样优化就错了,因为设备寄存器通常具有以下特性:

  • ● 设备寄存器中的数据不需要改写就可以自己发生变化,每次读上来的值可能不一样。
  • ● 连续多次向设备寄存器中写数据并不是在做无用功,而是给设备发命令,是有意义的。

用优化选项编译生成的指令明显效率更高,但使用不当会出错,为了避免编译器自作聪明,把不该优化的也优化了,程序员应该明确告诉编译器哪些内存单元的访问是不能优化的,在C语言中可以用volatile限定符修饰变量,就是告诉编译器,即使在编译时指定了优化选项,每次读这个变量仍然要老老实实从内存读取,每次写这个变量也仍然要老老实实写回内存,不能省略任何步骤。我们把代码的开头几行改成:

      /* artificial device registers */volatile unsigned char recv;volatile unsigned char send;

然后指定优化选项-O编译,查看反汇编的结果:

            buf[0] = recv;80483b7:      0f b6 0d 19 a0 04 08    movzbl 0x804a019,%ecx80483be:      88 0d 1a a0 04 08        mov   %cl,0x804a01abuf[1] = recv;80483c4:      0f b6 15 19 a0 04 08    movzbl 0x804a019,%edx80483cb:      88 15 1b a0 04 08        mov   %dl,0x804a01bbuf[2] = recv;80483d1:      0f b6 05 19 a0 04 08    movzbl 0x804a019,%eax80483d8:      a2 1c a0 04 08           mov   %al,0x804a01csend = ~buf[0];80483dd:      f7 d1                 not   %ecx80483df:      88 0d 18 a0 04 08        mov   %cl,0x804a018send = ~buf[1];80483e5:      f7 d2                 not   %edx80483e7:      88 15 18 a0 04 08        mov   %dl,0x804a018send = ~buf[2];80483ed:      f7 d0                 not   %eax80483ef:      a2 18 a0 04 08           mov   %al,0x804a018

确实每次读recv都从内存地址0x804a019读取,每次写send也都写到内存地址0x804a018了。值得注意的是,每次写send并不需要取出buf中的值,而是取出先前缓存在寄存器eax、edx、ecx中的值,做取反运算然后写下去,这是因为buf并没有用volatile限定,读者可以试着在buf的定义前面也加上volatile,再优化编译,再查看和比较反汇编的结果。

告诉编译器不不可信寄存器,给我去内存空间取值。

gcc的编译优化选项有-O0、-O、-O1、-O2、-O3、-Os几种。

  • -O0表示不优化,这是缺省的选项。
  • -O1、-O2和-O3这几个选项一个比一个优化得更多,编译时间也更长。
  • -O和-O1相同。
  • -Os表示为缩小目标文件的尺寸而优化。具体每种选项做了哪些优化请参考gcc参考文档。

从上面的例子还可以看到,如果在编译时指定了优化选项,源代码和生成指令的次序可能无法对应,甚至有些源代码可能不对应任何指令,被彻底优化掉了。

这一点在用gdb做源码级调试时尤其需要注意(做指令级调试没关系),在为调试而编译时不要指定优化选项,否则可能无法一步步跟踪源代码的执行过程。

有了volatile限定符可以防止编译器优化对设备寄存器的访问,但对于有Cache的平台仅仅这样还不够,还是无法防止Cache优化对设备寄存器的访问。

在访问内存地址时Cache对程序员是透明的,比如执行movzbl 0x804a019,%eax这样一条指令,我们并不知道eax的值是真的从内存地址0x804a019读到的,还是从Cache中读到的,如果Cache已经缓存了这个地址的数据就从Cache读,如果Cache没有缓存就从内存读,这些步骤都是硬件自动做的,而不是用指令控制Cache去做的,程序员写的指令中只有寄存器、内存地址,而没有Cache,程序员甚至不需要知道Cache的存在。

同样道理,如果执行了mov %al,0x804a01a这样一条指令,我们并不知道寄存器的值是真的写回内存了,还是只写到了Cache中,以后再由Cache写回内存,即使只写到了Cache中而暂时没有写回内存,下次读0x804a01a这个地址时仍然可以从Cache中读到上次写的数据。然而,在读写设备寄存器时Cache的存在就不容忽视了,如果串口发送和接收寄存器的内存地址被Cache缓存了会有什么问题呢?

在这里插入图片描述

如果串口发送寄存器的地址被Cahce缓存,CPU执行单元对串口发送寄存器做写操作都写到Cache中去了,串口发送寄存器并没有及时得到数据,也就不能及时发送,CPU执行单元先后发出的1、2、3三个字节都会写到Cache中的同一个单元,最后Cache中只保存了第3个字节,如果这时Cache把数据写回到串口发送寄存器,只能把第3个字节发出去,前两个字节就丢失了。

与此类似,如果串口接收寄存器的地址被Cache缓存,CPU执行单元在读第1个字节时,Cache会从串口接收寄存器读上来并缓存,然而串口接收寄存器后面收到的2、3两个字节Cache并不知道,因为Cache把串口接收寄存器当做普通内存单元,并且相信内存单元中的数据是不会自己变的,以后每次读串口接收寄存器时,Cache都会把缓存的第1个字节提供给CPU执行单元。

通常,有Cache的平台都有办法对某一段地址范围禁用Cache,一般是在页表中设置的,可以设定哪些页面允许Cache缓存,哪些页面不允许Cache缓存,MMU不仅要做地址转换和访问权限检查,也要配合Cache工作。

除了设备寄存器需要用volatile限定之外,当一个全局变量被同一进程中的多个控制流程访问时也要用volatile限定,比如信号处理函数和多线程就属于这种情况。主要的目的就是避免多个访问,出现无效和脏数据。

参考资料

《一站式学习C编程》

这篇关于C语言的本质(四):volatile限定符的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/246326

相关文章

Go 语言中的select语句详解及工作原理

《Go语言中的select语句详解及工作原理》在Go语言中,select语句是用于处理多个通道(channel)操作的一种控制结构,它类似于switch语句,本文给大家介绍Go语言中的select语... 目录Go 语言中的 select 是做什么的基本功能语法工作原理示例示例 1:监听多个通道示例 2:带

C语言函数递归实际应用举例详解

《C语言函数递归实际应用举例详解》程序调用自身的编程技巧称为递归,递归做为一种算法在程序设计语言中广泛应用,:本文主要介绍C语言函数递归实际应用举例的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录前言一、递归的概念与思想二、递归的限制条件 三、递归的实际应用举例(一)求 n 的阶乘(二)顺序打印

C语言中的数据类型强制转换

《C语言中的数据类型强制转换》:本文主要介绍C语言中的数据类型强制转换方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C语言数据类型强制转换自动转换强制转换类型总结C语言数据类型强制转换强制类型转换:是通过类型转换运算来实现的,主要的数据类型转换分为自动转换

利用Go语言开发文件操作工具轻松处理所有文件

《利用Go语言开发文件操作工具轻松处理所有文件》在后端开发中,文件操作是一个非常常见但又容易出错的场景,本文小编要向大家介绍一个强大的Go语言文件操作工具库,它能帮你轻松处理各种文件操作场景... 目录为什么需要这个工具?核心功能详解1. 文件/目录存javascript在性检查2. 批量创建目录3. 文件

C语言实现两个变量值交换的三种方式

《C语言实现两个变量值交换的三种方式》两个变量值的交换是编程中最常见的问题之一,以下将介绍三种变量的交换方式,其中第一种方式是最常用也是最实用的,后两种方式一般只在特殊限制下使用,需要的朋友可以参考下... 目录1.使用临时变量(推荐)2.相加和相减的方式(值较大时可能丢失数据)3.按位异或运算1.使用临时

使用C语言实现交换整数的奇数位和偶数位

《使用C语言实现交换整数的奇数位和偶数位》在C语言中,要交换一个整数的二进制位中的奇数位和偶数位,重点需要理解位操作,当我们谈论二进制位的奇数位和偶数位时,我们是指从右到左数的位置,本文给大家介绍了使... 目录一、问题描述二、解决思路三、函数实现四、宏实现五、总结一、问题描述使用C语言代码实现:将一个整

C语言字符函数和字符串函数示例详解

《C语言字符函数和字符串函数示例详解》本文详细介绍了C语言中字符分类函数、字符转换函数及字符串操作函数的使用方法,并通过示例代码展示了如何实现这些功能,通过这些内容,读者可以深入理解并掌握C语言中的字... 目录一、字符分类函数二、字符转换函数三、strlen的使用和模拟实现3.1strlen函数3.2st

Go语言中最便捷的http请求包resty的使用详解

《Go语言中最便捷的http请求包resty的使用详解》go语言虽然自身就有net/http包,但是说实话用起来没那么好用,resty包是go语言中一个非常受欢迎的http请求处理包,下面我们一起来学... 目录安装一、一个简单的get二、带查询参数三、设置请求头、body四、设置表单数据五、处理响应六、超

C语言中的浮点数存储详解

《C语言中的浮点数存储详解》:本文主要介绍C语言中的浮点数存储详解,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、首先明确一个概念2、接下来,讲解C语言中浮点型数存储的规则2.1、可以将上述公式分为两部分来看2.2、问:十进制小数0.5该如何存储?2.3 浮点

Java的volatile和sychronized底层实现原理解析

《Java的volatile和sychronized底层实现原理解析》文章详细介绍了Java中的synchronized和volatile关键字的底层实现原理,包括字节码层面、JVM层面的实现细节,以... 目录1. 概览2. Synchronized2.1 字节码层面2.2 JVM层面2.2.1 ente