Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?

本文主要是介绍Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1  go grpc-go 相关技术专栏 总入口

2  Protobuf介绍与实战 图文专栏 文章目录

本次测试环境是64位Mac系统

1、数据类型为int32,int64,uint32,uint64,bool,enum时,Varint是如何编码的?

1.1、测试用例1:先看一下十进制1的二进制形式;以及在64位操作系统下,1占用多少字节?

在这里插入图片描述

可以使用Varint编码进行改进。

1.2、测试用例2:使用Varint编码,传输十进制1的情况

在这里插入图片描述

如果不考虑是32位操作系统,还是64位操作系统的话,用1个字节来表示数值,当传输的数值小于128且 大于0时,Varint的编码结果跟二进制原码是一样的

1.3、测试用例3:使用Varint编码,传输十进制128的情况?

在这里插入图片描述

[00010000 10000000 00000001]

前面多余的0,可以不显示,为了分析,专门打印输出的。

好,先看第1个字节00010000
在这里插入图片描述

从第1个字节中,可以得到标识号,即得到变量类型,变量名称;以及变量值的编码方式

接下来,看第2,3个字节 10000000 00000001
在这里插入图片描述

在这里插入图片描述

即,通过解析第2,3字节,获得传输的是128。

uint32, int64,uint64类型就不再举例了,原理一样的。

1.4、测试用例4:使用Varint编码bool 类型的变量值

bool类型的变量值,本质可看做为0,1

在这里插入图片描述

在这里插入图片描述

1.4.1、当 bool类型的变量值为 false 时,其编码结果为空,为什么?

这是 Varint编码 为了提高编码效率做的一个小技巧:

若数据类型的变量值刚好为该类型的初始化值的话,Varint编码就采用空进行传输;

当接收方对某字段进行解析时,发现为空,就会按照此字段的默认值进行初始化;

1.4.2、验证一下:int32类型的变量,变量值为0时Varint编码的情况:

在这里插入图片描述

1.5、测试用例5:使用Varint编码,对enum 类型进行编码

在这里插入图片描述

在这里插入图片描述

enum类型的变量值,本质上还是整型数。

具体编码过程,跟int32类型是一样的,就不再具体写了。

2、数据类型为sint32,sint64时,Varint是如何编码的?(ZigZag编码)

前文我们已经分析了,如果使用Varint编码直接对负数进行编码的话,会占用很多字节,违背我们的初衷;

既然,Varint编码对正数很有效果,那么,能不能先将负数转换为正数呢?

sint32, sint64类型就是针对的是负数情况;

sin32,sint64类型,使用的是zigzag编码,该编码是对Varint编码的改进;

2.1、zigzag编码

zigzag编码的本质,是将负数按照一定的规则变换为一个正数,然后,在使用Varint编码的。

ZigZag编码将有符号数映射到无符号数以便具有较小绝对值的数字(如-1)也具有较小的varint编码值。

这样做的方式是通过正整数和负整数来回“曲折”,将-1编码为1,将1编码为2,将-2编码为3…………以此类推。

如下表所示:

Signed OriginalEncoded As
00
-11
12
-23
24
-35
21474836474294967294
-21474836484294967295

sint32类型的0,经过sint32编码后,为0

sint32类型的-1,经过sint32编码后,为1

sint32类型的1,经过sint32编码后,为2

sint32类型的-2,经过sint32编码后,为3

sint32类型的2,经过sint32编码后,为4


其实,

对于负奇数来说,公式:|-3|*2-1=5

对于正数来说,公式:数值*2

或者:可以从移位的角度看

如,int类型zigzag变换的代码表示为(n << 1) ^ (n >> 31)

有关介绍网址:
https://www.it610.com/article/1187247270198878208.htm
http://wikimore.github.io/2016/09/22/zig-zag-intro/
http://wikimore.github.io/2016/09/22/zig-zag-intro/
https://blog.csdn.net/mijichui2153/article/details/111475823

举例说明:
sint32类型的-300,
在这里插入图片描述

-300, 如果用int32类型表示的话,其实,|-300|*2-1=599

即,直接使用Varint对599进行编码:
在这里插入图片描述

如果某个类型的变量值一直是负数的话,可以使用sint32, sint64进行声明,从而提高了编码效率

或者说,某个类型的变量值大部分情况下是负数,也可以。

下一篇文章

  在proto文件中,数据类型为string,bytes,embedded messages,packed repeated fields时,变量值采用何种方式编码(Length-delimited)

这篇关于Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/374465

相关文章

Linux线程之线程的创建、属性、回收、退出、取消方式

《Linux线程之线程的创建、属性、回收、退出、取消方式》文章总结了线程管理核心知识:线程号唯一、创建方式、属性设置(如分离状态与栈大小)、回收机制(join/detach)、退出方法(返回/pthr... 目录1. 线程号2. 线程的创建3. 线程属性4. 线程的回收5. 线程的退出6. 线程的取消7.

MySQL 多列 IN 查询之语法、性能与实战技巧(最新整理)

《MySQL多列IN查询之语法、性能与实战技巧(最新整理)》本文详解MySQL多列IN查询,对比传统OR写法,强调其简洁高效,适合批量匹配复合键,通过联合索引、分批次优化提升性能,兼容多种数据库... 目录一、基础语法:多列 IN 的两种写法1. 直接值列表2. 子查询二、对比传统 OR 的写法三、性能分析

golang程序打包成脚本部署到Linux系统方式

《golang程序打包成脚本部署到Linux系统方式》Golang程序通过本地编译(设置GOOS为linux生成无后缀二进制文件),上传至Linux服务器后赋权执行,使用nohup命令实现后台运行,完... 目录本地编译golang程序上传Golang二进制文件到linux服务器总结本地编译Golang程序

Linux下删除乱码文件和目录的实现方式

《Linux下删除乱码文件和目录的实现方式》:本文主要介绍Linux下删除乱码文件和目录的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux下删除乱码文件和目录方法1方法2总结Linux下删除乱码文件和目录方法1使用ls -i命令找到文件或目录

Linux在线解压jar包的实现方式

《Linux在线解压jar包的实现方式》:本文主要介绍Linux在线解压jar包的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux在线解压jar包解压 jar包的步骤总结Linux在线解压jar包在 Centos 中解压 jar 包可以使用 u

zookeeper端口说明及介绍

《zookeeper端口说明及介绍》:本文主要介绍zookeeper端口说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、zookeeper有三个端口(可以修改)aVNMqvZ二、3个端口的作用三、部署时注意总China编程结一、zookeeper有三个端口(可以

Python办公自动化实战之打造智能邮件发送工具

《Python办公自动化实战之打造智能邮件发送工具》在数字化办公场景中,邮件自动化是提升工作效率的关键技能,本文将演示如何使用Python的smtplib和email库构建一个支持图文混排,多附件,多... 目录前言一、基础配置:搭建邮件发送框架1.1 邮箱服务准备1.2 核心库导入1.3 基础发送函数二、

java使用protobuf-maven-plugin的插件编译proto文件详解

《java使用protobuf-maven-plugin的插件编译proto文件详解》:本文主要介绍java使用protobuf-maven-plugin的插件编译proto文件,具有很好的参考价... 目录protobuf文件作为数据传输和存储的协议主要介绍在Java使用maven编译proto文件的插件

Jenkins分布式集群配置方式

《Jenkins分布式集群配置方式》:本文主要介绍Jenkins分布式集群配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1.安装jenkins2.配置集群总结Jenkins是一个开源项目,它提供了一个容易使用的持续集成系统,并且提供了大量的plugin满

PowerShell中15个提升运维效率关键命令实战指南

《PowerShell中15个提升运维效率关键命令实战指南》作为网络安全专业人员的必备技能,PowerShell在系统管理、日志分析、威胁检测和自动化响应方面展现出强大能力,下面我们就来看看15个提升... 目录一、PowerShell在网络安全中的战略价值二、网络安全关键场景命令实战1. 系统安全基线核查