理解内存对齐

2024-09-05 02:12
文章标签 内存 理解 对齐

本文主要是介绍理解内存对齐,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

序言

 相信大家已经看过不少关于如何计算内存对齐的文章了,但是大家大家有思考过吗,为什么需要内存对齐?为什么要做浪费内存资源的事?直接让数据挨在一起不就行了吗?本篇文章将简单介绍为什么需要内存对齐,以及理解了之后,我们再来看内存对齐。


1. 为什么需要内存对齐

 当我们在看一本英语书时,对于熟悉的单词,我们在大脑里面会迅速的反应,并将它翻译为对应的中文含义。但是,当一个单词出现如下情况:

diffe
rence

乍一看,我们会稍微反应一下,然后大脑会反应出,哦原来这是 difference 。当一本书中这种情况多了,就会大大降低我们的阅读效率!

 内存大家并不陌生,但是当内存和 CPU 进行数据交换时,一次交换的数据大小是一个字节吗?不是的,通常来说,是以一个字(32位下 4 字节,64位下 8 字节)来进行数据交换。再结合一段程序(本文都是 32位下)能更好的说明:

struct stu1
{char a; // 1int b; // 4
};int main()
{std::cout << sizeof(stu1) << std::endl;return 0;
}

如果不内存对齐的话,这个程序的输出结果是 5!内存上是这样的:
在这里插入图片描述

一个字长大小为 4 字节,如果 CPU 现在需要成员变量 b,需要读取两次,第一次读取获取高三个字节,最后一次获取一个字节。但是通过内存对齐后,是这样的:
在这里插入图片描述
这只需要读取一次就好啦!

 大家会认为内存读取数据的速度很快呀,读取两次和一次差不多吧?对 CPU 来说,简直是天差地别!在他眼里就一直等待… 所以为了加快 CPU 获取数据的速度,使用了内存对齐 — 加快访问速度,提高 CPU 执行效率!利用空间换取时间!


2. 内存对齐的规则

2.1 默认对齐数

 当每一次对齐时,我们需要将该数据的大小和默认对齐数进行比较,使用 较小的那一个作为对齐数! 默认对齐数设置方式也很简单,#pragma pack(n) 指令可以将默认的对齐数设置为 n,其中 n 可以是 1、2、4、8、16 等值,具体取决于编译器的支持。这意味着结构体中的成员将按照 n 字节对齐,而不是编译器默认的对齐方式。
 举个栗子:

#pragma pack(8) // 对齐数为 8struct stu1
{char a;int b;
};int main()
{std::cout << sizeof(stu1) << std::endl; // 输出结果 8return 0;
}
-------------------------------------手动分割线#pragma pack(1) // 对齐数为 1struct stu1
{char a;int b;
};int main()
{std::cout << sizeof(stu1) << std::endl; // 输出结果 5return 0;
}

 有些时候,虽然效率是加快了,但是浪费空间的缺点也不容小觑,对于对内存高度紧张的环境,我们就可以适当调节默认对齐数的大小。

2.2 只包含内置类型的场景

 在这个场景下结构体中只包含内置类型,默认对齐数为 4

struct stu1
{int a; // 4char b; // 1double c; // 8short d; // 2long long e; // 8
};int main()
{std::cout << sizeof(stu1) << std::endl;return 0;
}

具体怎么计算的呢,在这里我将介绍我自己使用的方法:

  1. a 开始,int 为 4 字节,和默认对齐数取小也是 4,从初始地址 1 开始占 4 个字节,现在地址更新到 4;
  2. bchar 为 1 字节,和默认对齐数取小是 1,不需要对齐,从地址 4 开始占 1 个字节,现在地址更新到 5;
  3. cdouble 为 8 字节,和默认对齐数取小是 4,需要对齐,到最近往后 4 的整数倍,从地址 8 开始占 8 个字节,现在地址更新到 16;
  4. dshort 为 2 字节,和默认对齐数取小是 2,不需要对齐,从地址 16 开始占 2 个字节,现在地址更新到 20;
  5. elong long 为 8 字节,和默认对齐数取小是 4,不需要对齐,从地址 20 开始占 8 个字节,现在地址更新到 28;
  6. 最后整个结构体的大小为 最大类型 和 默认对齐数 取小 的整数倍,最大类型为 long long 8 字节,默认对齐数取小是 4;28 已经是 4 的整数倍,所以结果是 28。

我们看看程序的输出:
在这里插入图片描述

2.3 内嵌结构体的场景

 对于内嵌结构体的场景,我们需要多一项关注 该结构体开始的位置需要是该结构体的最大类型(也要和默认对齐数取小)的整数倍!

#pragma pack(4)struct stu2
{int* ptr; // 4char ch; // 1
};struct stu1
{int a; // 4char b; // 1stu2 st; long long c; // 8
};int main()
{std::cout << sizeof(stu1) << std::endl;return 0;
}

在这里我们先计算 stu2 结构体的大小:

  1. ptr 开始,int* 为 4 字节,和默认对齐数取小也是 4,从初始地址 1 开始占 4 个字节,现在地址更新到 4;
  2. chchar 为 1 字节,和默认对齐数取小是 1,不需要对齐,从地址 4 开始占 1 个字节,现在地址更新到 5;
  3. 最后整个结构体的大小为 最大类型 和 默认对齐数 取小 的整数倍,最大类型为 int* 4 字节,默认对齐数取小是 4;5 不是 4 的整数倍,所以到最近往后 4 的整数倍 8

所以该结构体的大小就是 8 字节。

现在我们开始计算 stu1 结构体的大小:

  1. a 开始,int 为 4 字节,和默认对齐数取小也是 4,从初始地址 1 开始占 4 个字节,现在地址更新到 4;
  2. bchar 为 1 字节,和默认对齐数取小是 1,不需要对齐,从地址 4 开始占 1 个字节,现在地址更新到 5;
  3. ststu2 为 8 字节,该结构体最大类型和默认对齐数取小是 4,需要对齐,到最近往后 4 的整数倍,从地址 8 开始占 8 个字节,现在地址更新到 16;
  4. clong long 为 8 字节,和默认对齐数取小是 4,不需要对齐,从地址 16 开始占 8 个字节,现在地址更新到 24;
  5. 最后整个结构体的大小为 最大类型 和 默认对齐数 取小 的整数倍,最大类型为 long long 8 字节,默认对齐数取小是 4;24 已经是 4 的整数倍,所以结果是 24。

2.4 类中的其他成员

 我们还需要关注在类中的其他成员比如,静态成员函数,成员函数:

struct stu1
{char a;int b;static int c;void Print() {}
};int main()
{std::cout << sizeof(stu1) << std::endl;return 0;
}

在这里如果不存在后两者,stu1 的大小肯定是 8,加上两者呢?
在这里插入图片描述

怎么还是 8 呀?这是因为 成员函数和静态成员变量不独属于任何一个对象,他们属于这个类!sizeof 是计算该对象的大小,自然不算这两者!

2.5 包含虚函数的类

 请记住包含虚函数的类,还额外包含一个隐含的成员变量 — 虚函数表指针位于对象首部,他的对齐方式也很特殊 和类中的最大类型一致!在这里就不做演示了,大家可以自己尝试计算一下(依旧在 32 位下,但是默认对齐数产生了变化):

#pragma pack(8)struct stu1
{char a;long long b;virtual void Print() {}
};int main()
{std::cout << sizeof(stu1) << std::endl;return 0;
}

3. 总结

 在这里我们简单说了一下问什么需要内存对齐?以及内存对齐的相应场景,希望大家有所收获!

这篇关于理解内存对齐的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1137674

相关文章

一文带你理解Python中import机制与importlib的妙用

《一文带你理解Python中import机制与importlib的妙用》在Python编程的世界里,import语句是开发者最常用的工具之一,它就像一把钥匙,打开了通往各种功能和库的大门,下面就跟随小... 目录一、python import机制概述1.1 import语句的基本用法1.2 模块缓存机制1.

深入理解C语言的void*

《深入理解C语言的void*》本文主要介绍了C语言的void*,包括它的任意性、编译器对void*的类型检查以及需要显式类型转换的规则,具有一定的参考价值,感兴趣的可以了解一下... 目录一、void* 的类型任意性二、编译器对 void* 的类型检查三、需要显式类型转换占用的字节四、总结一、void* 的

深入理解Redis大key的危害及解决方案

《深入理解Redis大key的危害及解决方案》本文主要介绍了深入理解Redis大key的危害及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录一、背景二、什么是大key三、大key评价标准四、大key 产生的原因与场景五、大key影响与危

深入理解C++ 空类大小

《深入理解C++空类大小》本文主要介绍了C++空类大小,规定空类大小为1字节,主要是为了保证对象的唯一性和可区分性,满足数组元素地址连续的要求,下面就来了解一下... 目录1. 保证对象的唯一性和可区分性2. 满足数组元素地址连续的要求3. 与C++的对象模型和内存管理机制相适配查看类对象内存在C++中,规

关于Java内存访问重排序的研究

《关于Java内存访问重排序的研究》文章主要介绍了重排序现象及其在多线程编程中的影响,包括内存可见性问题和Java内存模型中对重排序的规则... 目录什么是重排序重排序图解重排序实验as-if-serial语义内存访问重排序与内存可见性内存访问重排序与Java内存模型重排序示意表内存屏障内存屏障示意表Int

如何测试计算机的内存是否存在问题? 判断电脑内存故障的多种方法

《如何测试计算机的内存是否存在问题?判断电脑内存故障的多种方法》内存是电脑中非常重要的组件之一,如果内存出现故障,可能会导致电脑出现各种问题,如蓝屏、死机、程序崩溃等,如何判断内存是否出现故障呢?下... 如果你的电脑是崩溃、冻结还是不稳定,那么它的内存可能有问题。要进行检查,你可以使用Windows 11

NameNode内存生产配置

Hadoop2.x 系列,配置 NameNode 内存 NameNode 内存默认 2000m ,如果服务器内存 4G , NameNode 内存可以配置 3g 。在 hadoop-env.sh 文件中配置如下。 HADOOP_NAMENODE_OPTS=-Xmx3072m Hadoop3.x 系列,配置 Nam

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

【C++高阶】C++类型转换全攻略:深入理解并高效应用

📝个人主页🌹:Eternity._ ⏩收录专栏⏪:C++ “ 登神长阶 ” 🤡往期回顾🤡:C++ 智能指针 🌹🌹期待您的关注 🌹🌹 ❀C++的类型转换 📒1. C语言中的类型转换📚2. C++强制类型转换⛰️static_cast🌞reinterpret_cast⭐const_cast🍁dynamic_cast 📜3. C++强制类型转换的原因📝