数据在计算机中的存储——数值数据的表示方法以及原码补码等系列深究

本文主要是介绍数据在计算机中的存储——数值数据的表示方法以及原码补码等系列深究,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 前言
  • 一、定点数的表示方法
  • 二、原码,反码与补码。
      • 1.机器数
      • 2.真值
    • 1.原码
    • 2.反码
    • 3.补码
  • 三、浮点数的表示方法
  • 总结


前言

数值在计算机中的表示方法这一块一直有些混乱,以此文深究记录保持记忆。
我们都知道,在计算机中数据的小数点并不是用某个二进制数字来表示的,而是用隐含的小数点的位置来表示的。根据小数点位置是否固定,将计算机中的数据表示格式分为两种,即定点格式浮点格式


一、定点数的表示方法

定点数指小数点在数中位置固定不变的数。定点数分为定点整数和定点小数,由于小数点位置固定不变,所以存储时小数点不进行存储,按照约定的位置计算数值。原理上讲,小数点的位置可以位于任何位置,但通常将定点数表示成纯小数或纯整数。

假设以机器字长n位表示定点数,从右至左,从高位到低位分别为x0,x1,x2…xn-1,xn,其中x0取值0和1分别表示正号和负号。如此,对于任意一个定点数x=xnxn-1…x2x1,在定点机器中可表示为:

在这里插入图片描述


如果上图表示纯小数的话,那么小数点就在符号位x0和值位x1中间。
如果表示纯整数,那么小数点位于Xn的右边。

二、原码,反码与补码。

在学习之前,我们补习一些前置知识。

1.机器数

一个数在计算机中的二进制表示形式, 叫做这个数的机器数。机器数是带符号的,在计算机用一个数的最高位存放符号, 正数为0, 负数为1.
比如,十进制中的数 +3 ,计算机字长为8位,转换成二进制就是00000011。如果是 -3 ,就是 10000011 。那么,这里的 00000011 和 10000011 就是机器数。

2.真值

因为第一位是符号位,所以机器数的形式值就不等于真正的数值。例如上面的有符号数 10000011,其最高位1代表负,其真正数值是 -3 而不是形式值131(10000011转换成十进制等于131)。
所以,为区别起见,将带符号位的机器数对应的真正数值称为机器数的真值。例:0000 0001的真值 = +000 0001 = +1,1000 0001的真值 = –000 0001 = –1

因此我的理解,机器数就是计算机用来存放数据时数据带有符号的二进制格式,而真值就是这个数的真实值。也就是将机器数的最高位符号位(0和1)变成符号。

好了,现在开始让我们正式学习原码,补码等变化规则:

1.原码

原码即真值

原码就是符号位加上真值的绝对值, 即用第一位表示符号, 其余位表示值. 比如如果是8位二进制:

先给一个公式(这个公式不必要记住,用来理解真值与原码的转换):
在这里插入图片描述
这里的x是真值,
我们用以上的公式代入做题:


x1= 0.1101  x2=-0.1010  x3=1001 x4=-1110
[x1]=0.1101    [x2]=1.1010
[x3]=01001     [x4]= 11110据观察所知:原码和真值之间就是将最高位的符号位变成了01, 其实换句话说,原码等于真值在最高位加上符号位。
我们再来对这个公式剖析,我们计算得知,这个公式对于正数其直接是[x]=x; 
对于负数:如果是小数,就在其最高位+1,也就是[x]=1-x,这里的x是负数,所以也就是 1+x,利用此结果将符号转换为1;
如果是负整数,直接在其最高为+1,也就是给真值取掉符号位之后加上2的n次方。  
负整数: -000 0001  取掉符号位  然后加上27次方, 也就等于 1000 0001  成功换算为原码。

2.反码

反码的表示方法是:

正数的反码是其本身负数的反码是在其原码的基础上, 符号位不变,其余各个位取反例:[+1] = [00000001]= [00000001][-1] = [10000001]= [11111110]

3.补码

补码的表示方法是:

正数的补码就是其本身
负数的补码是在其原码的基础上, 符号位不变, 其余各位取反, 最后+1. (即在反码的基础上+1)
例:
[+1] = [00000001]= [00000001]= [00000001][-1] = [10000001]= [11111110]= [11111111]

扩展(关于原码补码等深究)

三、浮点数的表示方法

在科学计算中,常常会遇到非常大或非常小的数值,如果用定点数来表示的话,很难同时满足数据的表示范围和运算精度的要求。为了解决这一问题,计算机中采用了浮点数格式。所谓浮点数格式,是指在表示数据时,将浮点数的范围和精度分别表示。
在这里插入图片描述
在上述浮点数的表示格式中,阶符占1位,阶码值占m位,数符占1位,尾数值占n位。
后来为了便于软件移植,IEEE754规定了浮点数的表示标准,也定义了单精度(32位浮点数),双精度(64位浮点数)常规格式,如下图
在这里插入图片描述
32位浮点数和64为浮点数中阶码的基数都是2.32位浮点数格式中,s是浮点数的的符号位,占1位,s=0表示正数,s=1表示负数,M是浮点数的尾数,放在低位部分,占23位,小数点放在浮点数的E和M之间,即M的最前面,实际尾数的取值为1.M;E是浮点数的阶码,占8位,阶符采用隐含方式。

浮点数的规格化:(正菜)
为了使浮点数格式统一,又尽可能提高其精度,通常采用浮点数规格化形式。

在IEEE754标准中,一个规格化的32位浮点数x的真值可表示为:

在这里插入图片描述
其中,S,M,E分别为32位浮点数表示格式和存储格式中的数符,尾数,公式中的E-127表示浮点数x的指数e,即e=E-127 或E=e+127。

在计算机中存储格式为16进制数(C2540000),其真值为:
先把存储格式表示为32位二进制数,
在这里插入图片描述
然后根据上图得出S=1 E=10000100 M=10101
代入公式(规格化公式)得:x=-110101=(-53)(10进制);
例题:


我们求出上面的二进制数(-10101)=十进制数(-53)在计算机中的存储格式。
将其二进制数表示为浮点数形式,并使其尾数为1.M的形式。
110101=1.10101X2^5;
由上可知 S=1;E=5+127=132=10000100; M=1010 1000 0000 0000
可得存储格式的二进制数为:
1100 0101 0100 0000 0000 0000 0000
转换为十六进制(C2540000)

以上就是浮点数规格化存储的转换。


总结

繁杂的小知识,乱而要精。

这篇关于数据在计算机中的存储——数值数据的表示方法以及原码补码等系列深究的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/404440

相关文章

Java中注解与元数据示例详解

《Java中注解与元数据示例详解》Java注解和元数据是编程中重要的概念,用于描述程序元素的属性和用途,:本文主要介绍Java中注解与元数据的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参... 目录一、引言二、元数据的概念2.1 定义2.2 作用三、Java 注解的基础3.1 注解的定义3.2 内

将sqlserver数据迁移到mysql的详细步骤记录

《将sqlserver数据迁移到mysql的详细步骤记录》:本文主要介绍将SQLServer数据迁移到MySQL的步骤,包括导出数据、转换数据格式和导入数据,通过示例和工具说明,帮助大家顺利完成... 目录前言一、导出SQL Server 数据二、转换数据格式为mysql兼容格式三、导入数据到MySQL数据

C++中使用vector存储并遍历数据的基本步骤

《C++中使用vector存储并遍历数据的基本步骤》C++标准模板库(STL)提供了多种容器类型,包括顺序容器、关联容器、无序关联容器和容器适配器,每种容器都有其特定的用途和特性,:本文主要介绍C... 目录(1)容器及简要描述‌php顺序容器‌‌关联容器‌‌无序关联容器‌(基于哈希表):‌容器适配器‌:(

Python判断for循环最后一次的6种方法

《Python判断for循环最后一次的6种方法》在Python中,通常我们不会直接判断for循环是否正在执行最后一次迭代,因为Python的for循环是基于可迭代对象的,它不知道也不关心迭代的内部状态... 目录1.使用enuhttp://www.chinasem.cnmerate()和len()来判断for

C#提取PDF表单数据的实现流程

《C#提取PDF表单数据的实现流程》PDF表单是一种常见的数据收集工具,广泛应用于调查问卷、业务合同等场景,凭借出色的跨平台兼容性和标准化特点,PDF表单在各行各业中得到了广泛应用,本文将探讨如何使用... 目录引言使用工具C# 提取多个PDF表单域的数据C# 提取特定PDF表单域的数据引言PDF表单是一

Java循环创建对象内存溢出的解决方法

《Java循环创建对象内存溢出的解决方法》在Java中,如果在循环中不当地创建大量对象而不及时释放内存,很容易导致内存溢出(OutOfMemoryError),所以本文给大家介绍了Java循环创建对象... 目录问题1. 解决方案2. 示例代码2.1 原始版本(可能导致内存溢出)2.2 修改后的版本问题在

四种Flutter子页面向父组件传递数据的方法介绍

《四种Flutter子页面向父组件传递数据的方法介绍》在Flutter中,如果父组件需要调用子组件的方法,可以通过常用的四种方式实现,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录方法 1:使用 GlobalKey 和 State 调用子组件方法方法 2:通过回调函数(Callb

一文详解Python中数据清洗与处理的常用方法

《一文详解Python中数据清洗与处理的常用方法》在数据处理与分析过程中,缺失值、重复值、异常值等问题是常见的挑战,本文总结了多种数据清洗与处理方法,文中的示例代码简洁易懂,有需要的小伙伴可以参考下... 目录缺失值处理重复值处理异常值处理数据类型转换文本清洗数据分组统计数据分箱数据标准化在数据处理与分析过

Java中Object类的常用方法小结

《Java中Object类的常用方法小结》JavaObject类是所有类的父类,位于java.lang包中,本文为大家整理了一些Object类的常用方法,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. public boolean equals(Object obj)2. public int ha

大数据小内存排序问题如何巧妙解决

《大数据小内存排序问题如何巧妙解决》文章介绍了大数据小内存排序的三种方法:数据库排序、分治法和位图法,数据库排序简单但速度慢,对设备要求高;分治法高效但实现复杂;位图法可读性差,但存储空间受限... 目录三种方法:方法概要数据库排序(http://www.chinasem.cn对数据库设备要求较高)分治法(常