《C语言深度解剖》(9):深度剖析数据在内存中的存储

2024-04-23 06:12

本文主要是介绍《C语言深度解剖》(9):深度剖析数据在内存中的存储,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

🤡博客主页:醉竺

🥰本文专栏:《C语言深度解剖》

😻欢迎关注:感谢大家的点赞评论+关注,祝您学有所成!


✨✨💜💛想要学习更多数据结构与算法点击专栏链接查看💛💜✨✨ 


1. 数据类型介绍

前面我们已经学习了基本的内置类型:

char        //字符数据类型
short       //短整型
int         //整形
long        //长整型
long long   //更长的整形
float       //单精度浮点数
double      //双精度浮点数
//C语言有没有字符串类型?

以及他们所占存储空间的大小。

类型的意义:

1. 使用这个类型开辟内存空间的大小(大小决定了使用范围)。

2. 如何看待内存空间的视角。 

1.1 类型的基本归类

整形家族: 

charunsigned charsigned char
shortunsigned short[int]signed short[int]
intunsigned intsigned int
longunsigned long[int]signed long[int]

字符在存储的时候存储的是ASCII码值,ASCII是整数,所以在归类的时候,字符属于整型家族 。

浮点数家族: 

float
double

构造类型:(自定义类型)

> 数组类型
> 结构体类型 struct
> 枚举类型 enum
> 联合类型 union

一个数组,把数组名去掉,剩下的就是这个数组的类型, 元素个数不一样,代表类型也不一样。

eg. int a[10] 和 int a[11]是不同的类型,第一个数组类型是int [10],第二个数组类型是int [11]. 所以说数组也是自定义类型。

指针类型 

int *pi;
char *pc;
float* pf;
void* pv;

C语言中所有“变量”的类型判断:把“变量”名去掉,剩下的就是该“变量”的类型。 

空类型: 

void 表示空类型(无类型)

通常应用于函数的返回类型、函数的参数、指针类型。

2. 整形在内存中的存储

我们之前讲过一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。 

那接下来我们谈谈数据在所开辟内存中到底是如何存储的?

比如:

int a = 20;
int b = -10;

我们知道为 a 分配四个字节的空间。 那如何存储? 下来了解下面的概念: 

2.1 原码、反码、补码

计算机中的整数有三种2进制表示方法,即原码反码补码

三种表示方法均有符号位数值位两部分,符号位都是用0表示“正”,用1表示“负”,而数值位

 正数的原、反、补码都相同。

负整数的三种表示方法各不相同。

原码

直接将数值按照正负数的形式翻译成二进制就可以得到原码。 

反码 

将原码的符号位不变,其他位依次按位取反就可以得到反码。

补码 

反码+1就得到补码。 

对于整形来说:数据存放内存中其实存放的是补码。 

为什么呢?

在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统 一处理;

同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。 

我们看看在内存中的存储:

我们可以看到对于a和b分别存储的是补码。

但是我们发现顺序有点不对劲。 这是又为什么? 

2.2 大小端介绍

什么大端小端: 

大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;

小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地址中。 

低位:指的是低权值位!

什么是数据的低位高位?

例如:十进制数:1356

1是数据的高位:千位 ;6是数据的低位:个位 

为什么有大端和小端: 

百度2015年系统工程师笔试题: 

请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序。(10分)

有两种方法实现:

但是两种方法实现的本质是一样的:选择一个简单的数字(这里选择的是数字1),判断其第一个字节存储的是什么,如果是0就是大端存储模式,如果是1就代表是小端存储模式。 

//代码1
#include <stdio.h>
int check_sys()
{int i = 1;return (*(char*)&i);
}
int main()
{int ret = check_sys();if (ret == 1){printf("小端\n");}else{printf("大端\n");}return 0;
}
//代码2
int check_sys()
{union{int i;char c;}un;un.i = 1;return un.c;
}

这里简单解释一下方法2为什么也可以实现,到后面深入学习到联合体的时候会进一步详细讲解,这里可以先掌握方法1.

  1. 定义一个联合体(union),联合体是一个特殊的数据类型,所有成员都从同一内存位置开始,所以同一时间只能存储其中一个成员的值。在这个联合体中,定义了两个成员:一个整数 int i; 和一个字符 char c;

  2. 将联合体 un 的整数成员 i 赋值为1。由于 int 类型通常大于 char 类型,如果系统是32位的话,int 将占用4个字节,这样整数1在内存中的表示(在小端字节序系统中)通常会是 01 00 00 00。也就是说,最低有效字节(最小的地址)存储了值1,而其他字节存储0。

  3. 由于联合体成员共享内存,char c; 将访问整数 i 第一个字节的内容。在小端系统中,由于1被存储在了最低位字节,char c 会读取到值1。在大端系统中,值1会被存储在最高位字节,而 char c 会读取到0。

  4. 函数返回 char c 的值。如果返回值为1,则系统为小端字节序。如果返回值为0,则系统为大端字节序。


2.3 练习(重难点)

  • C语言中的整数类型可以分为两种:有符号和无符号。
  • 有符号整数可以表示正数、负数和零, 而无符号整数仅能表示正数和零。
  • 无符号整数确实采用直接的二进制表示,所有的位都用于表示值,没有符号位。无符号整数不使用原码、反码和补码的概念,因为这些都是有符号整数的表示方法。
  • 在无符号整数中,所有的位,包括最高位,都是数值的一部分,没有一个位是用作符号位的。最高位的1或0并没有特殊的含义,它仅仅是数值的一部分,与其他位一样参与数值的表示。
  • 使用%u格式控制符打印无符号整数时,会直接以其十进制值输出非负整数。
  • 因此,使用%u打印无符号整数时,并不需要考虑原码、补码和反码的问题。以无符号形式打印的结果就是该无符号整数的真实值 。

a是char类型一个字节只能放8个比特位,所以截断了一些比特位,然后再整形提升。

下面程序输出什么?

 

有/无符号位数,是对存储在内存中数据的补码的一种看待(使用)方式!

同一个数字存储在内存中的二进制数字是一样的。

如果是以无符号位数的格式打印%u,那就把内存中数据的补码当成没有符号的数字使用(看待),直接打印出来这串二进制代表的十进制整数即可。

若是打印有符号位数%d,要把补码转换成原码所代表的十进制数字打印出来。

总之,存储内存中的数据是一样的,只不过以不同的方式来使用。 

这段代码看似是想循环打印256次"hello world",但实际上,它会导致一个无限循环,并且会无限地打印"hello world"。原因在于变量i的类型是unsigned char。

在C语言中,unsigned char的取值范围通常是0到255。当i增加到255并执行i++后,按照期望,i会变成256。但是,由于unsigned char的取值上限是255,所以当i尝试增加到256时,它实际上会溢出并回绕到0(这是无符号整数溢出时的正常行为),导致for循环的条件i <= 255始终为真。

这里补充一下char类型的取值范围

3. 浮点型在内存中的存储

常见的浮点数:

3.14159
1E10
浮点数家族包括: float、double、long double 类型。
浮点数表示的范围:float.h中定义

3.1 一个例子 

 浮点数存储的例子:

输出的结果是什么呢?

3.2 浮点数存储规则 

这篇关于《C语言深度解剖》(9):深度剖析数据在内存中的存储的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/927990

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

HDFS—存储优化(纠删码)

纠删码原理 HDFS 默认情况下,一个文件有3个副本,这样提高了数据的可靠性,但也带来了2倍的冗余开销。 Hadoop3.x 引入了纠删码,采用计算的方式,可以节省约50%左右的存储空间。 此种方式节约了空间,但是会增加 cpu 的计算。 纠删码策略是给具体一个路径设置。所有往此路径下存储的文件,都会执行此策略。 默认只开启对 RS-6-3-1024k

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

NameNode内存生产配置

Hadoop2.x 系列,配置 NameNode 内存 NameNode 内存默认 2000m ,如果服务器内存 4G , NameNode 内存可以配置 3g 。在 hadoop-env.sh 文件中配置如下。 HADOOP_NAMENODE_OPTS=-Xmx3072m Hadoop3.x 系列,配置 Nam

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl