本文主要是介绍编码格式科普ASCII unicode utf-8 usc-2 GB2312,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1.ASCII(标准版) 可以表示所有英文字符(包括大写和小写)和数字,长度为7bit,最多可以表示0-127 个值,2的7次方个数字。比如比如“a” 对照ASCII码的值为97(十进制)或1100001 (七位二进制)
2.ASCII(拓展版)长度为8bit ,最多可表示0-256个值,在ASCII标准版的基础上,增加了欧洲文字和特殊字符
3.unicode (以及升级版的usc-2和utf-8)一种全球化的标准字符码,包含了全世界所有的语言、文字、符号,usc-2和utf-8为unicode的升级版。usc-2用16位(16比特)(16bit)(2b)(2byte)(2字节)表示一个字符,最多可以表示2的16次方个字符,即65535个字符。utf-8是usc-2的升级版(包含usc-2的所有字符,向下兼容),用1-4个字节表示一个字符,即最多表示4个byte即2的32次方=4294967296(十进制)个数字。“中”用utf-8表示为“%u4E2D” ,而用unicode表示为“\u4e2d”
4.GB2312 ,国产的中文字符集,只能表示简体,无法表示繁体,时代的产物,已被淘汰
5.GBK,国产的中文字符集,GB2312的升级版,兼容GB2312
这篇关于编码格式科普ASCII unicode utf-8 usc-2 GB2312的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!