【C语言自定义类型详解进阶】结构体(补充结构体的对齐和位段,一口气看完系列,央妈都点赞的博文)

本文主要是介绍【C语言自定义类型详解进阶】结构体(补充结构体的对齐和位段,一口气看完系列,央妈都点赞的博文),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

1.结构体

1.1 结构的基础知识

1.2 结构的声明

1.2.1特殊的声明(匿名结构体类型)

1.3结构体变量的定义

1.4关于匿名结构体类型的补充

1.5结构体的自引用

1.6结构体变量的初始化

2.结构体内存对齐(重点)

2.1偏移量补充

2.2对齐规则 

2.3为什么会有对齐

2.4修改默认对齐数 

3.结构体传参 

4.位段

4.1什么是位段

4.2位段的内存分配 

4.3 位段的跨平台问题 

4.4位段的应用 


 

1.结构体

1.1 结构的基础知识

结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量

对比数组,数组是同类型数据的集合

1.2 结构的声明

struct tag     //首先给了一个struct的结构体关键字,tag是标签名我们可以自己自定义想取什么名字就取什么名字。

{

member-list;//成员列表,每一个成员都是成员变量,可以是不同的类型

}variable-list;//这是变量列表,到底在怎么用,我们来看实际例子,来上手定义一个学生例子。

struct Stu

{

char name[20];//名字

int age;//年龄

char sex[5];//性别

char id[20];//学号

}; //分号不能丢

1.2.1特殊的声明(匿名结构体类型)

在声明结构的时候,可以不完全的声明。将标签名省略的结构体

struct

{

int a;

char b;

float c;

 };

1.3结构体变量的定义

当我们有了结构体类型,我们来看一下如何定义结构体变量。

①在创建结构体的时候直接在类型后面定义结构体变量:

struct Stu
{char name[20];//名字int age;//年龄char sex[5];//性别char id[20];//学号
}s1,s2; //分号不能丢

s1,s2就是定义的结构体变量。

②声明好了结构体类型后单独利用类型创建变量

struct Stu
{char name[20];//名字int age;//年龄char sex[5];//性别char id[20];//学号
}; //分号不能丢struct Stu s1,s2;

③匿名结构体变量的定义只能在声明或者创建结构体类型的时候就定义,因为没有标签名就无法单独创建。

struct
{int a;char b;float c;
}a[20], *p;

上述代码定义了结构体类型的数组和指针。

1.4关于匿名结构体类型的补充

我们来看这两段代码:

struct
{int a;char b;float c;
}x;
struct
{int a;char b;float c;
}a[20], *p;

这两段代码由于都没有标签名,在我们看来那结构体类型似乎是一模一样的

但是两个结构体本质上是不同的,所以在使用的时候不可以第二个结构体定义的指针指向第一个结构体创建的变量:
p = &x;//错误写法

编译器会把上面的两个声明当成完全不同的两个类型。 所以是非法的

1.5结构体的自引用

在结构体中包含一个类型为该结构体本身的成员。

一定用结构体指针的形式看如下解释

补充数据结构知识:

数据结构:描述的是数据在内存中的组织结构

线性数据结构:

①.顺序表:

假如我要在内存中存储1,2,3,4,5

我就可以在内存中找一块连续的存储空间,比如找一个数组来存储:这就是顺序表

②.链表:我们也可以不找联系存储的空间来存放数据,不过我们可以这样通过1可以找到,2可以找到3这种方式比如:

我们把1,2,3这样的位置叫做链表的节点,每个节点中包含了自身的数据和下一个节点。这就是我们要讲的结构体的自引用:

那么要实现这个链表,有些伙伴可能就会这样去实现:

struct Node
{int data;struct Node next;
};

这样对吗?

当我们这样写,那我们能求出那sizeof(struct Node)是多少吗?

所以这种写法从本质上来说是错误的。

正确的实现方式是,前一个节点里面存储下一个节点的内容。我们来看一下实现方式:

struct Node
{int data;struct Node* next;
};

存放数据的一般叫做数据域,存放数据,指针叫做指针域

补充一个思考:

我们有些伙伴可能会这样写:

typedef struct
{int data;Node* next;
}Node;

对匿名结构体类型重定义为Node可以,但是:

我们对一个类型进行重定义的时候他必须先是一个完整的类型,这段代码就相当于,我还没有创建好Node这个类型就已经在使用了是不对的,

如果要这样用,我们可以这样写:不使用匿名结构体类型

typedef struct Node
{int data;struct Node* next;
}Node;

1.6结构体变量的初始化

①直接对变量赋值

struct SN
{char c;int i;
}sn1 = { 'q',100 };

②利用点操作符进行赋值:.

struct SN
{char c;int i;
}sn2 = { .i = 200,.c = 'w' };//当用点初始化的时候可以不在意顺序

③结构体嵌套初始化

struct Point
{int x;int y;
};struct Node
{int data;struct Point p;struct Node* next; 
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化

2.结构体内存对齐(重点)

题型考察结构体的大小,我们来看一下例子引入,请问如下这段代码输出分别为什么:

struct S1
{char c1;int i;char c2;
};
struct S2
{char c1;char c2;int i;
};
int main()
{printf("%d\n", sizeof(struct S1));printf("%d\n", sizeof(struct S2));return 0;
}

明明是两个一样的结构体,为什么却不一样大,要知道答案我们就要知道结构体的大小是如何计算的,结构体大小的计算并不是单单就靠结构体内部元素的类型大小来决定,让我们来看一下:

2.1偏移量补充

 offsetof()    这个宏可以计算结构体某一个成员相较于起始位置的偏移量

头文件:stddef.h

需要在宏中传入的是:结构体类型和结构体变量名,下面我们来计算一下结构体s1中成员的偏移量和S2结构体的偏移量

struct S1
{char c1;int i;char c2;
};
struct S2
{char c1;char c2;int i;
};
int main()
{/*printf("%d\n", sizeof(struct S1));printf("%d\n", sizeof(struct S2));*/printf("%d\n", offsetof(struct S1, c1));printf("%d\n", offsetof(struct S1, i));printf("%d\n", offsetof(struct S1, c2));return 0;
}

2.2对齐规则 

1. 第一个成员在与结构体变量偏移量为0的地址处。

2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。

对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。 VS中默认的值为8 Linux中没有默认对齐数,对齐数就是成员自身的大小

3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。所有成员对齐数的最大值。

4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整 体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

我们来看一下图解S1的对齐:

 

对对齐规则第四条的解释:

让我们来看一下结构体嵌套的对齐算法:

 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整 体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

看一下这段代码输出风别为多少

struct S3
{double d;char c;int i;
};struct S4
{char c1;struct S3 s3;double d;
};int main()
{printf("%d\n", sizeof(struct S3));printf("%d\n", sizeof(struct S4));return 0;
}

 

 

如果出行数组,就当做多个同类型数据处理

2.3为什么会有对齐

大部分的参考资料都是如是说的:

1. 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。比如某些平台规定整型必须存放在4的整数倍地址处。

2. 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访 问。

虽然浪费了一些空间,但是换来了访问效率的提升

总体来说: 结构体的内存对齐是拿空间来换取时间的做法。 那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到: 让占用空间小的成员尽量集中在一起。

2.4修改默认对齐数 

一般将对齐数设置为2^n次方,之前我们见过了 #pragma 这个预处理指令,这里我们再次使用,可以改变我们的默认对齐数。

例如:

#pragma pack(8)//设置默认对齐数为8

#pragma pack()//取消设置的默认对齐数,还原为默认

pragma pack(1)//设置默认对齐数为1

#pragma pack(1)//设置默认对齐数为1
struct S2
{char c1;int i;char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{printf("%d\n", sizeof(struct S1));return 0;
}

结论: 结构在对齐方式不合适的时候,我们可以自己更改默认对齐数。

后续更新到宏的讲解的时候会补充实现offsetof的实现

3.结构体传参 

结构体作为函数传参有两种方式,传地址和传形参如下:

struct S
{int data[1000];int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{printf("%d\n", ps->num);
}
int main()
{print1(s);  //传结构体print2(&s); //传地址return 0;
}

 

 函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。 如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的 下降。所以首选地址传参

4.位段

结构体讲了就得讲讲结构体实现 位段 的能力。

4.1什么是位段

位段的声明和结构是类似的,有两个不同:

1.位段的成员必须是 int、unsigned int 或signed int 。

2.位段的成员名后边有一个冒号和一个数字。

例如:以下就是一个位段类型

struct A
{int _a:2;int _b:5;int _c:10;int _d:30;
};

我们来看一下位段的大小是多少:

这里为什么打印8,我们来往下了解:

为什么存在位段来这样分配空间:

有的时候比如0/1、2、3这几个数只用三个二进制位就可以表示出来:

000 0001 010 011

2个比特位就够了,如果分配四个字节就会浪费30个比特位。

4.2位段的内存分配 

1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型

2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。

3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

比如给上述位段中的-a开辟内存到底从左开辟还是从右开辟,当开辟不够的时候是从新使用一块空间还是补充使用就行,c语言也没有规定。

我们来验证一下当前我们的环境下是如何开辟的 

我们先看一下可能的内存分配方式:

接着我们给位段创建变量并复制:

那我们就知道了当前环境下的位段的内存开辟形式。

4.3 位段的跨平台问题 

1. int 位段被当成有符号数还是无符号数是不确定的。

2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机 器会出问题。:如果位段类型是int,如果在早期16位机器上,int是16位比特位,两个字节

3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。

4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是 舍弃剩余的位还是利用,这是不确定的。

总结:

跟结构相比,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在。

4.4位段的应用 

网络底层中的ip数据包

设计成位段,好设计也方便,网络传输数据越小越好,传输速率快。

5.结语

以上就是本期的所有内容,知识含量蛮多,大家可以配合解释和原码运行理解。创作不易,大家如果觉得还可以的话,欢迎大家三连,有问题的地方欢迎大家指正,一起交流学习,一起成长,我是Nicn,正在c++方向前行的奋斗者,感谢大家的关注与喜欢。
 

 

这篇关于【C语言自定义类型详解进阶】结构体(补充结构体的对齐和位段,一口气看完系列,央妈都点赞的博文)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/691977

相关文章

Python装饰器之类装饰器详解

《Python装饰器之类装饰器详解》本文将详细介绍Python中类装饰器的概念、使用方法以及应用场景,并通过一个综合详细的例子展示如何使用类装饰器,希望对大家有所帮助,如有错误或未考虑完全的地方,望不... 目录1. 引言2. 装饰器的基本概念2.1. 函数装饰器复习2.2 类装饰器的定义和使用3. 类装饰

MySQL 中的 JSON 查询案例详解

《MySQL中的JSON查询案例详解》:本文主要介绍MySQL的JSON查询的相关知识,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录mysql 的 jsON 路径格式基本结构路径组件详解特殊语法元素实际示例简单路径复杂路径简写操作符注意MySQL 的 J

C语言中位操作的实际应用举例

《C语言中位操作的实际应用举例》:本文主要介绍C语言中位操作的实际应用,总结了位操作的使用场景,并指出了需要注意的问题,如可读性、平台依赖性和溢出风险,文中通过代码介绍的非常详细,需要的朋友可以参... 目录1. 嵌入式系统与硬件寄存器操作2. 网络协议解析3. 图像处理与颜色编码4. 高效处理布尔标志集合

Go语言开发实现查询IP信息的MCP服务器

《Go语言开发实现查询IP信息的MCP服务器》随着MCP的快速普及和广泛应用,MCP服务器也层出不穷,本文将详细介绍如何在Go语言中使用go-mcp库来开发一个查询IP信息的MCP... 目录前言mcp-ip-geo 服务器目录结构说明查询 IP 信息功能实现工具实现工具管理查询单个 IP 信息工具的实现服

Python ZIP文件操作技巧详解

《PythonZIP文件操作技巧详解》在数据处理和系统开发中,ZIP文件操作是开发者必须掌握的核心技能,Python标准库提供的zipfile模块以简洁的API和跨平台特性,成为处理ZIP文件的首选... 目录一、ZIP文件操作基础三板斧1.1 创建压缩包1.2 解压操作1.3 文件遍历与信息获取二、进阶技

一文详解Java异常处理你都了解哪些知识

《一文详解Java异常处理你都了解哪些知识》:本文主要介绍Java异常处理的相关资料,包括异常的分类、捕获和处理异常的语法、常见的异常类型以及自定义异常的实现,文中通过代码介绍的非常详细,需要的朋... 目录前言一、什么是异常二、异常的分类2.1 受检异常2.2 非受检异常三、异常处理的语法3.1 try-

Java中的@SneakyThrows注解用法详解

《Java中的@SneakyThrows注解用法详解》:本文主要介绍Java中的@SneakyThrows注解用法的相关资料,Lombok的@SneakyThrows注解简化了Java方法中的异常... 目录前言一、@SneakyThrows 简介1.1 什么是 Lombok?二、@SneakyThrows

Java中字符串转时间与时间转字符串的操作详解

《Java中字符串转时间与时间转字符串的操作详解》Java的java.time包提供了强大的日期和时间处理功能,通过DateTimeFormatter可以轻松地在日期时间对象和字符串之间进行转换,下面... 目录一、字符串转时间(一)使用预定义格式(二)自定义格式二、时间转字符串(一)使用预定义格式(二)自

Redis Pipeline(管道) 详解

《RedisPipeline(管道)详解》Pipeline管道是Redis提供的一种批量执行命令的机制,通过将多个命令一次性发送到服务器并统一接收响应,减少网络往返次数(RTT),显著提升执行效率... 目录Redis Pipeline 详解1. Pipeline 的核心概念2. 工作原理与性能提升3. 核

Python正则表达式语法及re模块中的常用函数详解

《Python正则表达式语法及re模块中的常用函数详解》这篇文章主要给大家介绍了关于Python正则表达式语法及re模块中常用函数的相关资料,正则表达式是一种强大的字符串处理工具,可以用于匹配、切分、... 目录概念、作用和步骤语法re模块中的常用函数总结 概念、作用和步骤概念: 本身也是一个字符串,其中