穿越代码之海:探寻结构体深层逻辑,展望未来应用新天地

本文主要是介绍穿越代码之海:探寻结构体深层逻辑,展望未来应用新天地,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

欢迎来到白刘的领域   Miracle_86.-CSDN博客

系列专栏  C语言知识

先赞后看,已成习惯

   创作不易,多多支持!

结构体作为一种数据结构,其定义和特点决定了它在各种应用中的广泛适用性。随着科技的进步和新兴行业的不断涌现,结构体在未来应用中将发挥更加重要的作用。

目录

一、结构体类型的声明

1.1 回顾

1.1.1 结构体的声明

1.1.2 结构体变量的创建和初始化 

1.2 结构体的特殊声明 

1.3 结构体的自引用 

二、结构体内存对齐

2.1 对齐规则

2.2 为什么有对齐规则

2.2.1 平台原因 (移植原因):

2.2.2 性能原因:

2.3 修改默认对齐数

三、结构体传参

四、位段

4.1 什么是位段

4.2 位段的内存分配

4.3 跨平台问题

4.4 位段的应用

4.5 位段使用的注意事项


一、结构体类型的声明

1.1 回顾

我们在学习操作符的时候,简单的介绍了结构体,这里稍微复习一下。

武器大师——操作符详解(下)-CSDN博客

1.1.1 结构体的声明
struct tag
{member-list;//成员列表
}variable-list //变量列表

其中tag表述结构体名,花括号里面放着成员列表,也就是要描述对象的各种属性。变量列表用来存放定义为该结构体类型的变量。

struct Stu
{char name[20];//名字int age;//年龄char sex[5];//性别char id[20];//学号
}; //分号不能丢
1.1.2 结构体变量的创建和初始化 
#include <stdio.h>
struct Stu
{char name[20];//名字int age;//年龄char sex[5];//性别char id[20];//学号
};
int main()
{//按照结构体成员的顺序初始化struct Stu s = { "张三", 20, "男", "20230818001" };printf("name: %s\n", s.name);printf("age : %d\n", s.age);printf("sex : %s\n", s.sex);printf("id : %s\n", s.id);//按照指定的顺序初始化struct Stu s2 = { .age = 18, .name = "lisi", .id = "20230818002", .sex = "女" };printf("name: %s\n", s2.name);printf("age : %d\n", s2.age);printf("sex : %s\n", s2.sex);printf("id : %s\n", s2.id);return 0;
}

1.2 结构体的特殊声明 

在声明结构体的时候,我们可以不完全声明,比如:

//匿名结构体类型
struct
{int a;char b;float c;
}x;
struct
{int a;char b;float c;
}a[20], * p;

 上面两个结构体在声明的时候省略了结构体标签(Tag)。

那么试想一下下面这行代码是否合法呢?

p = &x;

编译器会把两个声明当成两个类型,所以是非法的。

匿名的结构体类型,如果没有对结构体重命名的话,基本上只能使用一次。

1.3 结构体的自引用 

我们在结构体中包含一个类型为结构体本身的成员是否可以呢?

比如说我们定义一个链表的节点,首先我们简单介绍一下链表和节点:

链表是一种数据结构,它由节点组成,每个节点包含两部分数据和指向下一个节点的指针。

节点是链表中的基本单元,每个节点存储数据,并指向下一个节点。节点通常由一个具有数据成员的结构体或类表示,数据成员可以是任何类型的数据。

struct Node
{int data;struct Node next;
};

这么定义对吗?

仔细想想。这样其实不太合理,如果结构体里包含一个结构体,那结构体里的结构体就可以又包含一个结构体,以此类推就造成了无限大,是不合理的。

正确的自引用方式:

struct Node
{int data;struct Node* next;
};

在结构体自引用使用的过程中,夹杂着typedef对匿名结构体重命名,也会容易引发问题,看看下面的代码是否可行?

typedef struct
{int data;Node* next;
}Node;

 仔细想其实很简单,不可行,因为我在结构体里用了Node,而Node还没命名完,还是那句心法——从上到下,依次执行。

解决方案:

typedef struct Node
{int data;struct Node* next;
}Node;

二、结构体内存对齐

2.1 对齐规则

1.结构体的第一个成员要对齐到结构体变量起始位置偏移量为0的地址处

2.其它成员要对齐到某个数字(对齐数)的整数倍的地址处。

   对齐数 = 编译器默认的一个对齐数 与 该成员变量大小的较小值。

   VS中默认的对齐数为8。

   Linux中gcc没有默认对齐数,对齐数就是成员变量本身的大小。

3.结构体的总大小为最大对齐数(结构体中每个成员都有一个对齐数,所有对齐数中最大的)的整数倍。

4.如果遇到了结构体嵌套,嵌套的结构体成员对齐到自己的成员的最大对齐数的整数倍处。结构体整体大小就是所有最大对齐数(含嵌套结构体的成员的对齐数)的整数倍。

一些练习:

    //练习1struct S1{char c1;int i;char c2;};printf("%d\n", sizeof(struct S1));//练习2struct S2{char c1;char c2;int i;};printf("%d\n", sizeof(struct S2));//练习3struct S3{double d;char c;int i;};printf("%d\n", sizeof(struct S3));//练习4-结构体嵌套问题struct S4{char c1;struct S3 s3;double d;};printf("%d\n", sizeof(struct S4));

练习1:

首先由于1<8,所以c1,c2的对齐数为1,由于4<8,所以4为i的对齐数。同时4也是最大对齐数。

过程:首先一个字节放c1,i的对齐数是4,所以为了让i对齐,我们需要补充3个字节让i对齐,之后4个字节存放i,之后存放c2.目前总字节数:1+3(补)+4+1=9,9不是最大对齐数的倍数,所以继续补充3个字节到12,故总大小为12个字节。

练习2:

对齐数:c1、c2 —— 1,i —— 4。最大对齐数为4。

过程:一个字节放c1,一个字节放c2,目前两个字节,2不是4的倍数,补充2个字节然后放i,i占4个字节。目前1+1+2(补)+4=8,8是4的倍数,所以总大小为8。

练习3:

对齐数:d —— 8,c —— 1,i —— 4,最大对齐数为8。

过程:8个字节放d,1个字节放c,补充3个字节到12,4个字节存放i,总字节:8+1+3(补)+4=16,故总大小为16。

练习4:

对齐数:一个字节放c1,16个字节放S3,目前字节1+16,要补到24,然后放d。总字节:24+8=32,是8的倍数,故总大小为32。

运行结果:

2.2 为什么有对齐规则

2.2.1 平台原因 (移植原因):

不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。

2.2.2 性能原因:

数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。假设一个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对齐成8的倍数,那么就可以用一个内存操作来读或者写值了。否则,我们可能需要执行两次内存访问,因为对象可能被分放在两个8字节内存块中。

总体来说:结构体的内存对齐是拿空间来换取时间的做法。

所以我们在结构体的设计时,要尽量将占用空间小的成员集中在一起。

//例如:
struct S1
{char c1;int i;char c2;
};struct S2
{char c1;char c2;int i;
};

 s1与s2的成员一模一样,但是s1和s2的空间有着区别。

2.3 修改默认对齐数

我们可以通过#pragam这个预处理指令来修改编译器的默认对齐数。

#include <stdio.h>
#pragma pack(1)//设置默认对⻬数为1
struct S
{char c1;int i;char c2;
};
#pragma pack()//取消设置的对⻬数,还原为默认
int main()
{//输出的结果是什么?printf("%d\n", sizeof(struct S));return 0;
}

运行结果:

可能有人会问,不是又取消对齐数了嘛,怎么不应该是12呢?这里还是那句心法:从上到下,依次执行。我们已经创建好结构体大小了,它再取消的话其实是没有用的。

三、结构体传参

struct S
{int data[1000];int num;
};
struct S s = { {1,2,3,4}, 1000 };
//结构体传参
void print1(struct S s)
{printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{printf("%d\n", ps->num);
}
int main()
{print1(s); //传结构体print2(&s); //传地址return 0;
}

来观察上述两个函数,大家认为哪个比较好?

答案是print2。

原因是:函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销较大,所以会导致性能的下降。

结论:结构体传参的时候,要传结构体的地址。

四、位段

4.1 什么是位段

位段是一种用于存储和操作位(二进制位)的数据结构,它允许将多个位组合在一起表示特定类型的数据,节省内存空间。

位段的声明和结构体是类似的,但有一下两点不同:

1.位段的成员必须是 int、unsigned int 或 signed int ,在C99中位段成员的类型也可以选择其他类型。

2.位段的成员名后边有一个冒号和一个数字。

eg:

struct A
{int _a : 2;int _b : 5;int _c : 10;int _d : 30;
};

 A就是一个位段,那A的大小是多少呢?这就需要了解位段的内存分配。

4.2 位段的内存分配

1.位段的成员可以是 int、unsigned int、signed int 或者是 char 等类型。


2.位段的空间上是按照需要以4个字节(int)或者1个字节(char)的方式来开辟的。

3.位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

//⼀个例⼦
struct S
{char a : 3;char b : 4;char c : 5;char d : 4;
};
struct S s = { 0 };
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
//空间是如何开辟的?

 

4.3 跨平台问题

1..int 位段被当成有符号数还是无符号数是不确定的。

2.位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。

3.位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。

4.当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。

总结:跟结构相比,位段确实可以达到同样的效果,并且通常能够很好地节省空间。然而,位段确实存在跨平台的问题。由于不同编译器和平台对位段的处理方式可能不同,这可能导致在不同环境下程序的行为不一致。因此,在需要高度可移植性的场景中,使用位段需要特别小心,并进行充分的测试和验证。如果节省空间的需求不是特别迫切,或者跨平台兼容性更为重要,那么使用结构可能是一个更稳妥的选择。 

4.4 位段的应用

下图是网络协议中IP数据报的格式。确实,我们可以看到其中许多属性只需要较少的bit位就能描述。使用位段(bit-fields)在这种情况下是一个很好的选择,因为它能够实现所需的效果,同时节省空间。由于位段可以精确控制每个字段所占用的位数,所以它们非常适合用于表示那些只需要少量位数就能完整描述的信息。

在网络传输中,数据报的大小对于网络的畅通性至关重要。较小的数据报意味着在传输过程中所需的带宽和资源更少,这有助于减少网络拥塞和延迟。通过使用位段来减少数据报中每个字段的大小,我们可以有效地减小数据报的整体大小,从而提高网络的传输效率。

然而,需要注意的是,虽然位段在节省空间方面具有优势,但它们也带来了一些挑战。例如,位段的具体实现可能因编译器和平台的不同而有所差异,这可能导致跨平台兼容性问题。此外,过度使用位段可能会使代码变得难以理解和维护。因此,在决定是否使用位段时,需要权衡其优缺点,并根据具体的应用场景和需求做出决策。

4.5 位段使用的注意事项

位段的一个特性是,其成员可能共享同一个字节的存储空间,这导致某些成员的起始位置并非字节的起始边界。由于内存中每个字节分配一个地址,而字节内部的bit位是没有独立地址的,因此不能直接对位段的成员使用&操作符来获取其地址。

由于位段成员的这种地址特性,我们不能直接使用像scanf这样的函数来直接给位段的成员输入值。这是因为scanf等函数通常需要能够访问变量的内存地址来执行赋值操作,而位段成员并不总是拥有独立的、可寻址的内存位置。

因此,在实际编程中,我们通常需要先通过scanf等函数将输入值存放在一个临时变量中,然后再将这个临时变量的值赋给位段的成员。这样可以确保赋值操作的正确性和可靠性,避免因为位段成员地址的特殊性而导致的问题。

需要注意的是,位段的使用虽然可以节省空间,但也带来了一些限制和复杂性。在实际应用中,我们需要根据具体的需求和场景来权衡是否使用位段,并确保在使用过程中遵守相关的编程规范和最佳实践。

struct A
{int _a : 2;int _b : 5;int _c : 10;int _d : 30;
};
int main()
{struct A sa = { 0 };scanf("%d", &sa._b);//这是错误的//正确的⽰范int b = 0;scanf("%d", &b);sa._b = b;return 0;
}

完 

这篇关于穿越代码之海:探寻结构体深层逻辑,展望未来应用新天地的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/883360

相关文章

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

zoj3820(树的直径的应用)

题意:在一颗树上找两个点,使得所有点到选择与其更近的一个点的距离的最大值最小。 思路:如果是选择一个点的话,那么点就是直径的中点。现在考虑两个点的情况,先求树的直径,再把直径最中间的边去掉,再求剩下的两个子树中直径的中点。 代码如下: #include <stdio.h>#include <string.h>#include <algorithm>#include <map>#

活用c4d官方开发文档查询代码

当你问AI助手比如豆包,如何用python禁止掉xpresso标签时候,它会提示到 这时候要用到两个东西。https://developers.maxon.net/论坛搜索和开发文档 比如这里我就在官方找到正确的id描述 然后我就把参数标签换过来

usaco 1.3 Mixing Milk (结构体排序 qsort) and hdu 2020(sort)

到了这题学会了结构体排序 于是回去修改了 1.2 milking cows 的算法~ 结构体排序核心: 1.结构体定义 struct Milk{int price;int milks;}milk[5000]; 2.自定义的比较函数,若返回值为正,qsort 函数判定a>b ;为负,a<b;为0,a==b; int milkcmp(const void *va,c

poj 1258 Agri-Net(最小生成树模板代码)

感觉用这题来当模板更适合。 题意就是给你邻接矩阵求最小生成树啦。~ prim代码:效率很高。172k...0ms。 #include<stdio.h>#include<algorithm>using namespace std;const int MaxN = 101;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int n

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/