本文主要是介绍Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1 go grpc-go 相关技术专栏 总入口
2 Protobuf介绍与实战 图文专栏 文章目录
本次测试环境是64位Mac系统
1、数据类型为int32,int64,uint32,uint64,bool,enum时,Varint是如何编码的? |
1.1、测试用例1:先看一下十进制1的二进制形式;以及在64位操作系统下,1占用多少字节? |
可以使用Varint编码进行改进。
1.2、测试用例2:使用Varint编码,传输十进制1的情况 |
如果不考虑是32位操作系统,还是64位操作系统的话,用1个字节来表示数值,当传输的数值小于128且 大于0时,Varint的编码结果跟二进制原码是一样的
1.3、测试用例3:使用Varint编码,传输十进制128的情况? |
[00010000 10000000 00000001]
前面多余的0,可以不显示,为了分析,专门打印输出的。
好,先看第1个字节00010000
从第1个字节中,可以得到标识号,即得到变量类型,变量名称;以及变量值的编码方式
接下来,看第2,3个字节 10000000 00000001
即,通过解析第2,3字节,获得传输的是128。
uint32, int64,uint64类型就不再举例了,原理一样的。
1.4、测试用例4:使用Varint编码bool 类型的变量值 |
bool类型的变量值,本质可看做为0,1
1.4.1、当 bool类型的变量值为 false 时,其编码结果为空,为什么? |
这是 Varint编码 为了提高编码效率做的一个小技巧:
若数据类型的变量值刚好为该类型的初始化值的话,Varint编码就采用空进行传输;
当接收方对某字段进行解析时,发现为空,就会按照此字段的默认值进行初始化;
1.4.2、验证一下:int32类型的变量,变量值为0时Varint编码的情况: |
1.5、测试用例5:使用Varint编码,对enum 类型进行编码 |
enum类型的变量值,本质上还是整型数。
具体编码过程,跟int32类型是一样的,就不再具体写了。
2、数据类型为sint32,sint64时,Varint是如何编码的?(ZigZag编码) |
前文我们已经分析了,如果使用Varint编码直接对负数进行编码的话,会占用很多字节,违背我们的初衷;
既然,Varint编码对正数很有效果,那么,能不能先将负数转换为正数呢?
sint32, sint64类型就是针对的是负数情况;
sin32,sint64类型,使用的是zigzag编码,该编码是对Varint编码的改进;
2.1、zigzag编码 |
zigzag编码的本质,是将负数按照一定的规则变换为一个正数,然后,在使用Varint编码的。
ZigZag编码将有符号数映射到无符号数以便具有较小绝对值的数字(如-1)也具有较小的varint编码值。
这样做的方式是通过正整数和负整数来回“曲折”,将-1编码为1,将1编码为2,将-2编码为3…………以此类推。
如下表所示:
Signed Original | Encoded As |
---|---|
0 | 0 |
-1 | 1 |
1 | 2 |
-2 | 3 |
2 | 4 |
-3 | 5 |
… | … |
2147483647 | 4294967294 |
-2147483648 | 4294967295 |
sint32类型的0,经过sint32编码后,为0
sint32类型的-1,经过sint32编码后,为1
sint32类型的1,经过sint32编码后,为2
sint32类型的-2,经过sint32编码后,为3
sint32类型的2,经过sint32编码后,为4
…
其实,
对于负奇数来说,公式:|-3|*2-1=5
对于正数来说,公式:数值*2
或者:可以从移位的角度看
如,int类型zigzag变换的代码表示为(n << 1) ^ (n >> 31)
有关介绍网址:
https://www.it610.com/article/1187247270198878208.htm
http://wikimore.github.io/2016/09/22/zig-zag-intro/
http://wikimore.github.io/2016/09/22/zig-zag-intro/
https://blog.csdn.net/mijichui2153/article/details/111475823
举例说明:
sint32类型的-300,
-300, 如果用int32类型表示的话,其实,|-300|*2-1=599
即,直接使用Varint对599进行编码:
如果某个类型的变量值一直是负数的话,可以使用sint32, sint64进行声明,从而提高了编码效率
或者说,某个类型的变量值大部分情况下是负数,也可以。
下一篇文章
在proto文件中,数据类型为string,bytes,embedded messages,packed repeated fields时,变量值采用何种方式编码(Length-delimited)
这篇关于Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!