C语言中位域(bit fields)的可移植问题

2024-02-13 07:32

本文主要是介绍C语言中位域(bit fields)的可移植问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

网上有文章说C语言的“位域”(bit fields)有可移植性的问题,原因是不同的编译器对位域的实现不同。

  我决定用实验验证一下。

  一、 实验过程:

  1. 准备实验程序

  这 是谭浩强C语言课本上第12章12.2节的位域示例程序:


  main() {
  struct bs
  {
  unsigned a:1;
  unsigned b:3;
  unsigned c:4;
  } bit,*pbit;
  bit.a = 1;
  bit.b = 7;
  bit.c = 15;
  printf("%d,%d,%d\n", bit.a, bit.b, bit.c);
  pbit = &bit;
  pbit->a = 0;
  pbit->b &= 3;
  pbit->c |= 1;
  printf("%d,%d,%d\n", pbit->a, pbit->b, pbit->c);
  }

  我将它改写成:


  #include
  int main(int argc, char** argv)
  {
  struct bitfields
  {
  unsigned long a:1;
  unsigned long b:3;
  unsigned long c:4;
  unsigned long d:8;
  unsigned long e:16;
  unsigned long f:32;
  };
  union
  {
  struct bitfields bit;
  unsigned long longhex;
  unsigned long long longlonghex;
  } union_bit;
  union_bit.bit.a = 1;
  union_bit.bit.b = 7;
  union_bit.bit.c = 8;
  union_bit.bit.d = 0x70;
  union_bit.bit.e = 0x5060;
  union_bit.bit.f = 0x10203040;
  printf("a=%d b=%d c=%d d=0x%x\ne=0x%x f=0x%lx\n", union_bit.bit.a,
  union_bit.bit.b, union_bit.bit.c, union_bit.bit.d, union_bit.bit.e, union_bit.bit.f);
  printf("*(unsigned long*)(&bit) = %lx\n", union_bit.longhex);
  printf("*(unsigned long long*)(&bit) = %llx\n", union_bit.longlonghex);
  union_bit.bit.a = 0;
  union_bit.bit.b = 3;
  union_bit.bit.c = 9;
  printf("a=%d b=%d c=%d d=0x%x\ne=0x%x f=0x%lx\n", union_bit.bit.a,
  union_bit.bit.b, union_bit.bit.c, union_bit.bit.d, union_bit.bit.e, union_bit.bit.f);
  printf("*(unsigned long*)(&bit) = %lx\n", union_bit.longhex);
  printf("*(unsigned long long*)(&bit) = %llx\n", union_bit.longlonghex);
  printf("sizeof unsigned long = %d\n", sizeof(unsigned long));
  printf("sizeof struct bitfields = %d\n", sizeof(struct bitfields));
  return 0;
  }

  2. 在不同的软硬件环境中运行实验程序,得到结果

  1) 运行环境一:

  硬件:1颗双核单线程的Pentium E5300, 主频2.60 GHz, 3 GB内存

  软件:Fedora 12(内核2.6.31.5), gcc 4.4.2, glibc 2.11, 32位OS ,32位C编译器

  运行结果:


  a=1 b=7 c=8 d=0x70
  e=0x5060 f=0x10203040
  *(unsigned long*)(&bit) = 5060708f
  *(unsigned long long*)(&bit) = 102030405060708f
  a=0 b=3 c=9 d=0x70
  e=0x5060 f=0x10203040
  *(unsigned long*)(&bit) = 50607096
  *(unsigned long long*)(&bit) = 1020304050607096
  sizeof unsigned long = 4
  sizeof struct bitfields = 8

  2) 运行环境二:

  硬件:1颗UltraSPARC T1, 主频1.0 GHz, 8核心×每核4线程, 64位32线程CPU, 8 GB内存

  软件:Solaris 10 Update 3 for SPARC, 64位OS, 32位C编译器

  运行结果:

 


 a=1 b=7 c=8 d=0x70
  e=0x5060 f=0x10203040
  *(unsigned long*)(&bit) = f8705060
  *(unsigned long long*)(&bit) = f870506010203040
  a=0 b=3 c=9 d=0x70
  e=0x5060 f=0x10203040
  *(unsigned long*)(&bit) = 39705060
  *(unsigned long long*)(&bit) = 3970506010203040
  sizeof unsigned long = 4
  sizeof struct bitfields = 8

3) 运行环境三:

  硬件:1 颗双核单线程的Intel Xeon 3050芯片, CPU 主频为2.13 GHz, 配置8 GB内存

  软件:FreeBSD 6.2, 64位OS, 64位C编译器

  运行结果:


  a=1 b=7 c=8 d=0x70
  e=0x5060 f=0x7fff10203040
  *(unsigned long*)(&bit) = 102030405060708f
  *(unsigned long long*)(&bit) = 102030405060708f
  a=0 b=3 c=9 d=0x70
  e=0x5060 f=0x7fff10203040
  *(unsigned long*)(&bit) = 1020304050607096
  *(unsigned long long*)(&bit) = 1020304050607096
  sizeof unsigned long = 8
  sizeof struct bitfields = 8

  二、 实验结果分析:

  在32位x86系统上,位域对应的二进制位为:

  ffffffff ffffffff ffffffff ffffffff eeeeeeee eeeeeeee dddddddd ccccbbba

  因为long类型是32位,所以把整个bitfields作为unsigned long输出时,输出了整个bitfields的一部分:

  eeeeeeee eeeeeeee dddddddd ccccbbba

  在64位SPARC系统上,位域对应的二进制位为:

  abbbcccc dddddddd eeeeeeee eeeeeeee ffffffff ffffffff ffffffff ffffffff

  因为long类型是32位,所以把整个bitfields作为unsigned long输出时,也输出了整个bitfields的一部分:

  abbbcccc dddddddd eeeeeeee eeeeeeee

  在64位x86系统上,位域对应的二进制位为:

  ffffffff ffffffff ffffffff ffffffff eeeeeeee eeeeeeee dddddddd ccccbbba

  因为long类型是64位,在printf的时候"f=0x%lx"读取到了bitfields以外的内存,所以导致f=0x7fff10203040这样的结果。

  并且,把整个bitfields作为unsigned long输出时,输出了整个bitfields的全部内容。

  三、 实验结论:

  1. 机器的字长和字节序,会直接影响到“位域”的值。

  2. long类型,在64位编译器中是64位的数据类型;而在32位编译器中是32位数据类型。

  3. long long 数据类型,在32位编译器和64位编译器中,都是64位类型。

  注:关于字节序的说明:

  大端字节(big endian)是指低地址存放最高有效位(MSB: Most Significant Bit);

  小端字节(little endian)是低地址存放最低有效位(LSB: Least Significant Bit)。

  用文字说明可能比较抽象,下面用图像加以说明。

  比如数字0x0A0B0C0D在两种不同字节序CPU中的存储顺序如下所示:

  Big Endian

  低地址 ------> 高地址

  +----+----+----+----+

  | 0A | 0B | 0C | 0D |

  +----+----+----+----+

  Little Endian

  低地址 ------> 高地址

  +----+----+----+----+

  | 0D | 0C | 0B | 0A |

  +----+----+----+----+

  Intel 80x86, MOS Technology 6502, Z80, VAX, PDP-11 处理器为 Little endian。

  Motorola 6800, Motorola 68000, PowerPC 970, System/370, SPARC(除V9外) 处理器为 Big endian。

  ARM, PowerPC (除PowerPC 970外), DEC Alpha, SPARC V9, MIPS, PA-RISC, Intel IA64 的字节序是可配置的。

  为什么要注意字节序的问题呢?你可能这么问。当然,如果你写的程序只在单机环境下面运行,并且不和别人的程序打交道,那么你完全可以忽略字节序的存在。但是,如果你的程序要跟别人的程序产生交互呢?在这里我想说说两种语言。C/C++语言编写的程序里数据存储顺序是跟编译平台所在的CPU相关的,而JAVA编写的程序则唯一采用big endian方式来存储数据。试想,如果你用C/C++语言在x86平台下编写的程序跟别人的JAVA程序互通时会产生什么结果?就拿上面的0x12345678来说,你的程序传递给别人的一个数据,将指向0x12345678的指针传给了JAVA程序,由于JAVA采取big endian方式存储数据,很自然的它会将你的数据翻译为0x78563412。什么?竟然变成另外一个数字了?是的,就是这种后果。因此,在你的C程序传给JAVA程序之前有必要进行字节序的转换工作。

  无独有偶,所有网络协议也都是采用big endian的方式来传输数据的。所以有时我们也会把big endian方式称之为网络字节序。当两台采用不同字节序的主机通信时,在发送数据之前都必须经过字节序的转换成为网络字节序后再进行传输。

这篇关于C语言中位域(bit fields)的可移植问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/704893

相关文章

线上Java OOM问题定位与解决方案超详细解析

《线上JavaOOM问题定位与解决方案超详细解析》OOM是JVM抛出的错误,表示内存分配失败,:本文主要介绍线上JavaOOM问题定位与解决方案的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录一、OOM问题核心认知1.1 OOM定义与技术定位1.2 OOM常见类型及技术特征二、OOM问题定位工具

Vue3绑定props默认值问题

《Vue3绑定props默认值问题》使用Vue3的defineProps配合TypeScript的interface定义props类型,并通过withDefaults设置默认值,使组件能安全访问传入的... 目录前言步骤步骤1:使用 defineProps 定义 Props步骤2:设置默认值总结前言使用T

Web服务器-Nginx-高并发问题

《Web服务器-Nginx-高并发问题》Nginx通过事件驱动、I/O多路复用和异步非阻塞技术高效处理高并发,结合动静分离和限流策略,提升性能与稳定性... 目录前言一、架构1. 原生多进程架构2. 事件驱动模型3. IO多路复用4. 异步非阻塞 I/O5. Nginx高并发配置实战二、动静分离1. 职责2

解决升级JDK报错:module java.base does not“opens java.lang.reflect“to unnamed module问题

《解决升级JDK报错:modulejava.basedoesnot“opensjava.lang.reflect“tounnamedmodule问题》SpringBoot启动错误源于Jav... 目录问题描述原因分析解决方案总结问题描述启动sprintboot时报以下错误原因分析编程异js常是由Ja

GO语言短变量声明的实现示例

《GO语言短变量声明的实现示例》在Go语言中,短变量声明是一种简洁的变量声明方式,使用:=运算符,可以自动推断变量类型,下面就来具体介绍一下如何使用,感兴趣的可以了解一下... 目录基本语法功能特点与var的区别适用场景注意事项基本语法variableName := value功能特点1、自动类型推

GO语言中函数命名返回值的使用

《GO语言中函数命名返回值的使用》在Go语言中,函数可以为其返回值指定名称,这被称为命名返回值或命名返回参数,这种特性可以使代码更清晰,特别是在返回多个值时,感兴趣的可以了解一下... 目录基本语法函数命名返回特点代码示例命名特点基本语法func functionName(parameters) (nam

MySQL 表空却 ibd 文件过大的问题及解决方法

《MySQL表空却ibd文件过大的问题及解决方法》本文给大家介绍MySQL表空却ibd文件过大的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考... 目录一、问题背景:表空却 “吃满” 磁盘的怪事二、问题复现:一步步编程还原异常场景1. 准备测试源表与数据

解决Nginx启动报错Job for nginx.service failed because the control process exited with error code问题

《解决Nginx启动报错Jobfornginx.servicefailedbecausethecontrolprocessexitedwitherrorcode问题》Nginx启... 目录一、报错如下二、解决原因三、解决方式总结一、报错如下Job for nginx.service failed bec

SysMain服务可以关吗? 解决SysMain服务导致的高CPU使用率问题

《SysMain服务可以关吗?解决SysMain服务导致的高CPU使用率问题》SysMain服务是超级预读取,该服务会记录您打开应用程序的模式,并预先将它们加载到内存中以节省时间,但它可能占用大量... 在使用电脑的过程中,CPU使用率居高不下是许多用户都遇到过的问题,其中名为SysMain的服务往往是罪魁

Go语言连接MySQL数据库执行基本的增删改查

《Go语言连接MySQL数据库执行基本的增删改查》在后端开发中,MySQL是最常用的关系型数据库之一,本文主要为大家详细介绍了如何使用Go连接MySQL数据库并执行基本的增删改查吧... 目录Go语言连接mysql数据库准备工作安装 MySQL 驱动代码实现运行结果注意事项Go语言执行基本的增删改查准备工作