数据在计算机中的存储——数值数据的表示方法以及原码补码等系列深究

本文主要是介绍数据在计算机中的存储——数值数据的表示方法以及原码补码等系列深究,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 前言
  • 一、定点数的表示方法
  • 二、原码,反码与补码。
      • 1.机器数
      • 2.真值
    • 1.原码
    • 2.反码
    • 3.补码
  • 三、浮点数的表示方法
  • 总结


前言

数值在计算机中的表示方法这一块一直有些混乱,以此文深究记录保持记忆。
我们都知道,在计算机中数据的小数点并不是用某个二进制数字来表示的,而是用隐含的小数点的位置来表示的。根据小数点位置是否固定,将计算机中的数据表示格式分为两种,即定点格式浮点格式


一、定点数的表示方法

定点数指小数点在数中位置固定不变的数。定点数分为定点整数和定点小数,由于小数点位置固定不变,所以存储时小数点不进行存储,按照约定的位置计算数值。原理上讲,小数点的位置可以位于任何位置,但通常将定点数表示成纯小数或纯整数。

假设以机器字长n位表示定点数,从右至左,从高位到低位分别为x0,x1,x2…xn-1,xn,其中x0取值0和1分别表示正号和负号。如此,对于任意一个定点数x=xnxn-1…x2x1,在定点机器中可表示为:

在这里插入图片描述


如果上图表示纯小数的话,那么小数点就在符号位x0和值位x1中间。
如果表示纯整数,那么小数点位于Xn的右边。

二、原码,反码与补码。

在学习之前,我们补习一些前置知识。

1.机器数

一个数在计算机中的二进制表示形式, 叫做这个数的机器数。机器数是带符号的,在计算机用一个数的最高位存放符号, 正数为0, 负数为1.
比如,十进制中的数 +3 ,计算机字长为8位,转换成二进制就是00000011。如果是 -3 ,就是 10000011 。那么,这里的 00000011 和 10000011 就是机器数。

2.真值

因为第一位是符号位,所以机器数的形式值就不等于真正的数值。例如上面的有符号数 10000011,其最高位1代表负,其真正数值是 -3 而不是形式值131(10000011转换成十进制等于131)。
所以,为区别起见,将带符号位的机器数对应的真正数值称为机器数的真值。例:0000 0001的真值 = +000 0001 = +1,1000 0001的真值 = –000 0001 = –1

因此我的理解,机器数就是计算机用来存放数据时数据带有符号的二进制格式,而真值就是这个数的真实值。也就是将机器数的最高位符号位(0和1)变成符号。

好了,现在开始让我们正式学习原码,补码等变化规则:

1.原码

原码即真值

原码就是符号位加上真值的绝对值, 即用第一位表示符号, 其余位表示值. 比如如果是8位二进制:

先给一个公式(这个公式不必要记住,用来理解真值与原码的转换):
在这里插入图片描述
这里的x是真值,
我们用以上的公式代入做题:


x1= 0.1101  x2=-0.1010  x3=1001 x4=-1110
[x1]=0.1101    [x2]=1.1010
[x3]=01001     [x4]= 11110据观察所知:原码和真值之间就是将最高位的符号位变成了01, 其实换句话说,原码等于真值在最高位加上符号位。
我们再来对这个公式剖析,我们计算得知,这个公式对于正数其直接是[x]=x; 
对于负数:如果是小数,就在其最高位+1,也就是[x]=1-x,这里的x是负数,所以也就是 1+x,利用此结果将符号转换为1;
如果是负整数,直接在其最高为+1,也就是给真值取掉符号位之后加上2的n次方。  
负整数: -000 0001  取掉符号位  然后加上27次方, 也就等于 1000 0001  成功换算为原码。

2.反码

反码的表示方法是:

正数的反码是其本身负数的反码是在其原码的基础上, 符号位不变,其余各个位取反例:[+1] = [00000001]= [00000001][-1] = [10000001]= [11111110]

3.补码

补码的表示方法是:

正数的补码就是其本身
负数的补码是在其原码的基础上, 符号位不变, 其余各位取反, 最后+1. (即在反码的基础上+1)
例:
[+1] = [00000001]= [00000001]= [00000001][-1] = [10000001]= [11111110]= [11111111]

扩展(关于原码补码等深究)

三、浮点数的表示方法

在科学计算中,常常会遇到非常大或非常小的数值,如果用定点数来表示的话,很难同时满足数据的表示范围和运算精度的要求。为了解决这一问题,计算机中采用了浮点数格式。所谓浮点数格式,是指在表示数据时,将浮点数的范围和精度分别表示。
在这里插入图片描述
在上述浮点数的表示格式中,阶符占1位,阶码值占m位,数符占1位,尾数值占n位。
后来为了便于软件移植,IEEE754规定了浮点数的表示标准,也定义了单精度(32位浮点数),双精度(64位浮点数)常规格式,如下图
在这里插入图片描述
32位浮点数和64为浮点数中阶码的基数都是2.32位浮点数格式中,s是浮点数的的符号位,占1位,s=0表示正数,s=1表示负数,M是浮点数的尾数,放在低位部分,占23位,小数点放在浮点数的E和M之间,即M的最前面,实际尾数的取值为1.M;E是浮点数的阶码,占8位,阶符采用隐含方式。

浮点数的规格化:(正菜)
为了使浮点数格式统一,又尽可能提高其精度,通常采用浮点数规格化形式。

在IEEE754标准中,一个规格化的32位浮点数x的真值可表示为:

在这里插入图片描述
其中,S,M,E分别为32位浮点数表示格式和存储格式中的数符,尾数,公式中的E-127表示浮点数x的指数e,即e=E-127 或E=e+127。

在计算机中存储格式为16进制数(C2540000),其真值为:
先把存储格式表示为32位二进制数,
在这里插入图片描述
然后根据上图得出S=1 E=10000100 M=10101
代入公式(规格化公式)得:x=-110101=(-53)(10进制);
例题:


我们求出上面的二进制数(-10101)=十进制数(-53)在计算机中的存储格式。
将其二进制数表示为浮点数形式,并使其尾数为1.M的形式。
110101=1.10101X2^5;
由上可知 S=1;E=5+127=132=10000100; M=1010 1000 0000 0000
可得存储格式的二进制数为:
1100 0101 0100 0000 0000 0000 0000
转换为十六进制(C2540000)

以上就是浮点数规格化存储的转换。


总结

繁杂的小知识,乱而要精。

这篇关于数据在计算机中的存储——数值数据的表示方法以及原码补码等系列深究的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/404440

相关文章

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

HDFS—存储优化(纠删码)

纠删码原理 HDFS 默认情况下,一个文件有3个副本,这样提高了数据的可靠性,但也带来了2倍的冗余开销。 Hadoop3.x 引入了纠删码,采用计算的方式,可以节省约50%左右的存储空间。 此种方式节约了空间,但是会增加 cpu 的计算。 纠删码策略是给具体一个路径设置。所有往此路径下存储的文件,都会执行此策略。 默认只开启对 RS-6-3-1024k

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi