理解内存对齐

2024-09-05 02:12
文章标签 内存 理解 对齐

本文主要是介绍理解内存对齐,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

序言

 相信大家已经看过不少关于如何计算内存对齐的文章了,但是大家大家有思考过吗,为什么需要内存对齐?为什么要做浪费内存资源的事?直接让数据挨在一起不就行了吗?本篇文章将简单介绍为什么需要内存对齐,以及理解了之后,我们再来看内存对齐。


1. 为什么需要内存对齐

 当我们在看一本英语书时,对于熟悉的单词,我们在大脑里面会迅速的反应,并将它翻译为对应的中文含义。但是,当一个单词出现如下情况:

diffe
rence

乍一看,我们会稍微反应一下,然后大脑会反应出,哦原来这是 difference 。当一本书中这种情况多了,就会大大降低我们的阅读效率!

 内存大家并不陌生,但是当内存和 CPU 进行数据交换时,一次交换的数据大小是一个字节吗?不是的,通常来说,是以一个字(32位下 4 字节,64位下 8 字节)来进行数据交换。再结合一段程序(本文都是 32位下)能更好的说明:

struct stu1
{char a; // 1int b; // 4
};int main()
{std::cout << sizeof(stu1) << std::endl;return 0;
}

如果不内存对齐的话,这个程序的输出结果是 5!内存上是这样的:
在这里插入图片描述

一个字长大小为 4 字节,如果 CPU 现在需要成员变量 b,需要读取两次,第一次读取获取高三个字节,最后一次获取一个字节。但是通过内存对齐后,是这样的:
在这里插入图片描述
这只需要读取一次就好啦!

 大家会认为内存读取数据的速度很快呀,读取两次和一次差不多吧?对 CPU 来说,简直是天差地别!在他眼里就一直等待… 所以为了加快 CPU 获取数据的速度,使用了内存对齐 — 加快访问速度,提高 CPU 执行效率!利用空间换取时间!


2. 内存对齐的规则

2.1 默认对齐数

 当每一次对齐时,我们需要将该数据的大小和默认对齐数进行比较,使用 较小的那一个作为对齐数! 默认对齐数设置方式也很简单,#pragma pack(n) 指令可以将默认的对齐数设置为 n,其中 n 可以是 1、2、4、8、16 等值,具体取决于编译器的支持。这意味着结构体中的成员将按照 n 字节对齐,而不是编译器默认的对齐方式。
 举个栗子:

#pragma pack(8) // 对齐数为 8struct stu1
{char a;int b;
};int main()
{std::cout << sizeof(stu1) << std::endl; // 输出结果 8return 0;
}
-------------------------------------手动分割线#pragma pack(1) // 对齐数为 1struct stu1
{char a;int b;
};int main()
{std::cout << sizeof(stu1) << std::endl; // 输出结果 5return 0;
}

 有些时候,虽然效率是加快了,但是浪费空间的缺点也不容小觑,对于对内存高度紧张的环境,我们就可以适当调节默认对齐数的大小。

2.2 只包含内置类型的场景

 在这个场景下结构体中只包含内置类型,默认对齐数为 4

struct stu1
{int a; // 4char b; // 1double c; // 8short d; // 2long long e; // 8
};int main()
{std::cout << sizeof(stu1) << std::endl;return 0;
}

具体怎么计算的呢,在这里我将介绍我自己使用的方法:

  1. a 开始,int 为 4 字节,和默认对齐数取小也是 4,从初始地址 1 开始占 4 个字节,现在地址更新到 4;
  2. bchar 为 1 字节,和默认对齐数取小是 1,不需要对齐,从地址 4 开始占 1 个字节,现在地址更新到 5;
  3. cdouble 为 8 字节,和默认对齐数取小是 4,需要对齐,到最近往后 4 的整数倍,从地址 8 开始占 8 个字节,现在地址更新到 16;
  4. dshort 为 2 字节,和默认对齐数取小是 2,不需要对齐,从地址 16 开始占 2 个字节,现在地址更新到 20;
  5. elong long 为 8 字节,和默认对齐数取小是 4,不需要对齐,从地址 20 开始占 8 个字节,现在地址更新到 28;
  6. 最后整个结构体的大小为 最大类型 和 默认对齐数 取小 的整数倍,最大类型为 long long 8 字节,默认对齐数取小是 4;28 已经是 4 的整数倍,所以结果是 28。

我们看看程序的输出:
在这里插入图片描述

2.3 内嵌结构体的场景

 对于内嵌结构体的场景,我们需要多一项关注 该结构体开始的位置需要是该结构体的最大类型(也要和默认对齐数取小)的整数倍!

#pragma pack(4)struct stu2
{int* ptr; // 4char ch; // 1
};struct stu1
{int a; // 4char b; // 1stu2 st; long long c; // 8
};int main()
{std::cout << sizeof(stu1) << std::endl;return 0;
}

在这里我们先计算 stu2 结构体的大小:

  1. ptr 开始,int* 为 4 字节,和默认对齐数取小也是 4,从初始地址 1 开始占 4 个字节,现在地址更新到 4;
  2. chchar 为 1 字节,和默认对齐数取小是 1,不需要对齐,从地址 4 开始占 1 个字节,现在地址更新到 5;
  3. 最后整个结构体的大小为 最大类型 和 默认对齐数 取小 的整数倍,最大类型为 int* 4 字节,默认对齐数取小是 4;5 不是 4 的整数倍,所以到最近往后 4 的整数倍 8

所以该结构体的大小就是 8 字节。

现在我们开始计算 stu1 结构体的大小:

  1. a 开始,int 为 4 字节,和默认对齐数取小也是 4,从初始地址 1 开始占 4 个字节,现在地址更新到 4;
  2. bchar 为 1 字节,和默认对齐数取小是 1,不需要对齐,从地址 4 开始占 1 个字节,现在地址更新到 5;
  3. ststu2 为 8 字节,该结构体最大类型和默认对齐数取小是 4,需要对齐,到最近往后 4 的整数倍,从地址 8 开始占 8 个字节,现在地址更新到 16;
  4. clong long 为 8 字节,和默认对齐数取小是 4,不需要对齐,从地址 16 开始占 8 个字节,现在地址更新到 24;
  5. 最后整个结构体的大小为 最大类型 和 默认对齐数 取小 的整数倍,最大类型为 long long 8 字节,默认对齐数取小是 4;24 已经是 4 的整数倍,所以结果是 24。

2.4 类中的其他成员

 我们还需要关注在类中的其他成员比如,静态成员函数,成员函数:

struct stu1
{char a;int b;static int c;void Print() {}
};int main()
{std::cout << sizeof(stu1) << std::endl;return 0;
}

在这里如果不存在后两者,stu1 的大小肯定是 8,加上两者呢?
在这里插入图片描述

怎么还是 8 呀?这是因为 成员函数和静态成员变量不独属于任何一个对象,他们属于这个类!sizeof 是计算该对象的大小,自然不算这两者!

2.5 包含虚函数的类

 请记住包含虚函数的类,还额外包含一个隐含的成员变量 — 虚函数表指针位于对象首部,他的对齐方式也很特殊 和类中的最大类型一致!在这里就不做演示了,大家可以自己尝试计算一下(依旧在 32 位下,但是默认对齐数产生了变化):

#pragma pack(8)struct stu1
{char a;long long b;virtual void Print() {}
};int main()
{std::cout << sizeof(stu1) << std::endl;return 0;
}

3. 总结

 在这里我们简单说了一下问什么需要内存对齐?以及内存对齐的相应场景,希望大家有所收获!

这篇关于理解内存对齐的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1137674

相关文章

Redis 内存淘汰策略深度解析(最新推荐)

《Redis内存淘汰策略深度解析(最新推荐)》本文详细探讨了Redis的内存淘汰策略、实现原理、适用场景及最佳实践,介绍了八种内存淘汰策略,包括noeviction、LRU、LFU、TTL、Rand... 目录一、 内存淘汰策略概述二、内存淘汰策略详解2.1 ​noeviction(不淘汰)​2.2 ​LR

Python中如何控制小数点精度与对齐方式

《Python中如何控制小数点精度与对齐方式》在Python编程中,数据输出格式化是一个常见的需求,尤其是在涉及到小数点精度和对齐方式时,下面小编就来为大家介绍一下如何在Python中实现这些功能吧... 目录一、控制小数点精度1. 使用 round() 函数2. 使用字符串格式化二、控制对齐方式1. 使用

Golang基于内存的键值存储缓存库go-cache

《Golang基于内存的键值存储缓存库go-cache》go-cache是一个内存中的key:valuestore/cache库,适用于单机应用程序,本文主要介绍了Golang基于内存的键值存储缓存库... 目录文档安装方法示例1示例2使用注意点优点缺点go-cache 和 Redis 缓存对比1)功能特性

Go使用pprof进行CPU,内存和阻塞情况分析

《Go使用pprof进行CPU,内存和阻塞情况分析》Go语言提供了强大的pprof工具,用于分析CPU、内存、Goroutine阻塞等性能问题,帮助开发者优化程序,提高运行效率,下面我们就来深入了解下... 目录1. pprof 介绍2. 快速上手:启用 pprof3. CPU Profiling:分析 C

golang内存对齐的项目实践

《golang内存对齐的项目实践》本文主要介绍了golang内存对齐的项目实践,内存对齐不仅有助于提高内存访问效率,还确保了与硬件接口的兼容性,是Go语言编程中不可忽视的重要优化手段,下面就来介绍一下... 目录一、结构体中的字段顺序与内存对齐二、内存对齐的原理与规则三、调整结构体字段顺序优化内存对齐四、内

深入理解Apache Airflow 调度器(最新推荐)

《深入理解ApacheAirflow调度器(最新推荐)》ApacheAirflow调度器是数据管道管理系统的关键组件,负责编排dag中任务的执行,通过理解调度器的角色和工作方式,正确配置调度器,并... 目录什么是Airflow 调度器?Airflow 调度器工作机制配置Airflow调度器调优及优化建议最

Linux内存泄露的原因排查和解决方案(内存管理方法)

《Linux内存泄露的原因排查和解决方案(内存管理方法)》文章主要介绍了运维团队在Linux处理LB服务内存暴涨、内存报警问题的过程,从发现问题、排查原因到制定解决方案,并从中学习了Linux内存管理... 目录一、问题二、排查过程三、解决方案四、内存管理方法1)linux内存寻址2)Linux分页机制3)

Java循环创建对象内存溢出的解决方法

《Java循环创建对象内存溢出的解决方法》在Java中,如果在循环中不当地创建大量对象而不及时释放内存,很容易导致内存溢出(OutOfMemoryError),所以本文给大家介绍了Java循环创建对象... 目录问题1. 解决方案2. 示例代码2.1 原始版本(可能导致内存溢出)2.2 修改后的版本问题在

大数据小内存排序问题如何巧妙解决

《大数据小内存排序问题如何巧妙解决》文章介绍了大数据小内存排序的三种方法:数据库排序、分治法和位图法,数据库排序简单但速度慢,对设备要求高;分治法高效但实现复杂;位图法可读性差,但存储空间受限... 目录三种方法:方法概要数据库排序(http://www.chinasem.cn对数据库设备要求较高)分治法(常

Redis多种内存淘汰策略及配置技巧分享

《Redis多种内存淘汰策略及配置技巧分享》本文介绍了Redis内存满时的淘汰机制,包括内存淘汰机制的概念,Redis提供的8种淘汰策略(如noeviction、volatile-lru等)及其适用场... 目录前言一、什么是 Redis 的内存淘汰机制?二、Redis 内存淘汰策略1. pythonnoe